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统计 /数学 


你 将 从 本 书 学 到 什么 ? 


如 果 有 一 本 探讨 统计 学 的 书籍 ， 能 够 让 直方 图 (histogram) 、 概 率 分 布 

(probability distribution) 、 卡 方 分 析 (chi square analysis) 的 学 习 不 再 像 看 牙医 
那么 恐怖 ， 那 该 有 多 好 ? 正 是 《深入 浅 出 统计 学 》 这 一 本 书 ， 为 这 个 枯燥 的 领域 带 
来 鲜 活 的 乐趣 ， 运 用 充满 互动 性 的 真实 世界 情节 ， 教 导 你 有 关 这 门 学 科 的 所 有 基 
础 ， 内 容 涵盖 其 广 ， 从 分 析 运 动 比赛 、 博 弈 游戏 到 临床 药物 试验 都 有 。 


不 管 你 是 在 修 习 统计 学 ， 准 备 统计 学 考试 ， 或 者 只 是 对 统计 分 析 抱 着 极 大 的 好 奇 
心 ，“ 深 入 浅 出 ”系列 的 撰写 风格 都 能 为 你 提供 莫大 的 帮助 ， 不 仅 让 你 充分 掌握 统 
计 学 的 要 又 ， 更 会 告诉 你 如 何 将 统计 理论 应 用 到 日 常生 活 中 。 
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我 们 认为 你 的 时 间 极 其 宝贵 ， 不 该 浪费 在 冥 思 昔 想 各 种 新 名 词 、 新 概念 上 。《 深 入 
浅 出 统计 学 》 运 用 认 知 科学 与 学 习 理论 的 最 新 研究 成 果 ， 精 心 建构 出 一 段 引发 多 重 
感知 的 学 习 体验 。 《深入浅出 统计 学 》 采 取 专 为 大 脑 运作 而 设计 的 丰富 视觉 化 风 
格 ， 你 将 不 再 被 密密麻麻 的 文字 催 得 展 民 欲 睡 。 
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“ 《深入浅出 统计 学 》 是 


目前 市 面 上 最 具 娱 乐 性 、 
最 能 够 抓 住 读者 注意 力 
的 统计 学 研读 指南 。 透 
过 生动 活泼 的 手法 与 素 
材 ， 为 这 个 困难 的 主题 
提供 最 容易 被 接受 的 学 
习 方 式 ， 贯 穿 全 书 的 精 
辟 解 说 让 各 种 程度 的 学 
生 都 能 够 充分 地 理解 统 
计 学 的 妙 义 。” 
阿 瑞 娜 "安德森 
(Ariana Anderson) ， 
加 利 福 尼 亚 大 党 洛 杉 i 
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“ 《深入浅出 统计 学 》 运 用 


简单 的 生活 实例 ， 提 供 

最 符合 直觉 的 理解 方式 ， 

让 统计 理论 的 学 习 既 有 
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深入 浅 出 统计 学 
Head First Statistics 
要 是 有 那么 一 本 关于 统计 党 的 


书 , 未 再 像 看 秘 医 那么 奴 贿 ， 访 有 
多 好 ? 可 这 不 过 是 个 梦 罢 了 .……. 





Dawn Griffiths 著 
李 芳 译 


电子 工党 出 版 社 . 
Publishing House of Electronics Industry 
北京 * BEJING 


内 容 简介 


《深入 浅 出 统计 学 》 有 具有 深入 浅 出 系列 的 一 贯 特色 ， 提 供 最 符合 直觉 的 理解 方式 ， 让 统 
计 理 论 的 学 习 既 有 趣 又 自然 。 从 应 对 考试 到 解决 实际 问题 ,无论 你 是 学 生还 是 数据 分 析 师 ， 
都 能 从 中 受益 。 本 书 涵盖 的 知识 点 包括 ; 信息 可 视 化 、 概 率 计算 、 几 何 分 布 、 二 项 分 布 
及 泊 众 分 布 、 正 态 分 布 、 统 计 抽 样 、 置 信 区 间 的 构建 、 假 设 检验 、 卡 方 分 布 、 相 关 与 回 
归 等 等 ,完整 涵盖 AP 考试 范围 。 本 书 运用 充满 互动 性 的 真实 世界 情节 ， 教 给 你 有 关 这 
门 学 科 的 所 有 基础 ,为 这 个 枯燥 的 领域 带 来 鲜 活 的 乐趣 ,不 仅 让 你 充分 掌握 统计 学 的 要 义 ， 
更 会 告诉 你 如 何 将 统计 理论 应 用 到 日 常生 活 中 。 
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“《 深 入 浅 出 统计 学 》 是 目前 市 面 上 最 具 娱 乐 性 、 最 能 够 抓 住 读 者 注意 力 的 统计 学 研读 指南 。 透 过 生动 
活泼 的 手法 与 赛 材 ， 为 这 个 困难 的 主题 提供 最 容易 被 接受 的 学 习 方 式 ， 贯 穿 全 书 的 精 降 解说 让 各 种 程 
度 的 学 生 都 能 够 充分 地 理解 统计 学 的 妙 义 。” 

-一 阿 瑞 娜 .安德森 【Ariana Anderson 》， 加 利 福 尼 亚 大 学 洛 杉 研 分 校 统计 系 教 师 助 理 及 
博士 生 


“有 《深入 浅 出 统计 学 》 润 物 细 无 声 。 当 一 口气 看 完 讲 解 和 练习 后 ， 你 就 会 发 现 自己 在 社交 谈 活 中 可 以 开 
口 闭口 正 态 分 布 、 泊 松 分 布 ， 我 保证 并 没有 人 建议 你 这 么 做 !" 


一 加里. 活 尔 夫 (Gary Wolf) ，《 连 线 》 杂 志 ( Wired Magazine ) 特约 编辑 


“ 道 恩 ' 格 里 菲 思 把 一 些 十 分 复杂 的 概念 拆 分 为 一 块 块 小 材料 ， 它 们 不 那么 令 人 望 而 生 苦 ， 凡 夫 俗 子 都 
会 觉得 十 分 容易 掌握 。 大 量 图 形 、 图 片 让 材料 具体 生动 ，458 页 那 位 吵 着 要 买 口香糖 球 的 迷人 女 模特 
已 然 让 我 心 生 人 情怀 。” 

-一 布鲁斯 ， 弗 雷 〈Bruce Frey ) ，《 统 计 学 技巧 》 (Statistics Hacks ) 作者 


“《 深 入 小 出 统计 学 》 运 用 简单 的 生活 实例 ， 提 供 最 符合 直觉 的 理解 方式 ， 让 统计 理论 的 学 习 既 有 趣 又 
自然 。” 
一 迈克 尔 。 普 瑞 诺 ( Michael Prerau ) ,波士顿 大 学 计算 神经 科学 和 统计 学 讲 病 


“你 以 为 “深入浅出 ”图 书 只 适合 计算 机 迷 吗 ?” 不妨 试 试用 本 书 提供 的 方式 学 习 统计 学 ， 你 就 会 改变 想 
法 。 这 方法 的 确 有 用 。” 


一 安 迪 ， 帕 克 ( Andy Parker ) 


“这 本 书 非常 适合 学 生 学 习 统 计 学 一 寅 教 于 乐 、 讲 解 全 面 、 易 于 理解 。 完 美 无 缺 的 方法 ! ” 
一 丹 妮 尔 ， 菜 维 特 〔( Danielle Levitt ) 


“打倒 其 他 枯 煤 无 味 的 统计 书 ! 连 我 的 猫 都 喜欢 这 一 本 。” 
一 饥 里 . 科 利 特 ( Cary Collett ) 


本 书 荐 辞 


深入 浅 出 系列 图 书 美 浴 
“ 凯 西 和 伯 特 合 著 的 《深信 浅 出 Java》 让 白 纸 黑 字 扬 身 一 变 ， 成 为 读者 领略 过 的 最 接近 图 形 用 户 界面 的 
作品 。 作 者 以 幽默 、 新 潮 的 风格 ， 让 学 习 Java 成 为 不 断 追问 “他 们 后 来 怎么 样 了 ? ， 的 愉快 体验 。” 


一 活 伦 ， 柯 费 尔 (Warren Keuffel ) ，《 软 件 开发 》 杂 志 ( Software Development ) 


“《 深 人 浅 出 Javay 引 人 人 和 人 胜 的 风格 会 把 本 来 一 无 所 知 的 你 变 成 斗志 昂扬 的 Java 战 士 ， 不 仅 如 此 ， 书 中 
还 收入 了 大 量 实用 事例 ， 这 样 的 实用 事例 在 其 他 文章 中 只 会 留 给 慌 怖 的 “读者 练习 ”。 此 书 蹇 智 、 幽 
默 、 新 潮 而 实用 -一 能 在 讲授 对 象 序列 化 和 网 络 加 载 协议 知识 的 同时 有 这 样 的 主张 并 坚持 做 到 的 书籍 
并 不 多 见 。 

-一 丹 . 罗素 (Dan Russell ) 博士 ，IBM Almaden 研 究 中 心 用 户 科学 和 用 户 体 验 研究 宣 主 
任 ( 兼 斯 坦 福 大 学 人 工 物 能 教师 ) 





“此 书 明 快 ， 风 趣 ， 玩 世 不 恭 ， 引 人 人 和信 胜 。 细 心 读 一 你 可 能 确实 能 学 到 东西 1 ” 


一 肯 ， 阿诺德 (Ken Arnold ) ， 曾 任 Sun Microsystems 裔 级 工程 师 ， 与 Jjava 创 始 人 座 姆 
斯 葬 斯 林 (James Gosling ) 合 著 《Java 编 程 语言 》( The Java Programming Language ) 


“如 醒 柄 灌顶， 脑海 中 堆积 如 山 的 书本 知识 一 下 子 消化 了 。” 
-一 沃 德 . 坎 宁 安 (Ward Cunningham ) ， 维 基 概 念 发 明 人 ，Hillside Group 创立 人 


“ 正 合 我 们 这 些 喜欢 研究 技术 、 生 活 随意 的 程序 员 的 口味 ， 实 用 开发 策 赂 的 称 手 参考 书 一 让 我 的 大 脑 
尽情 运转 ， 无 须 硬 着 头皮 应 付 迁 腐 芝 味 的 专家 说 教 。” 
一 特 拉 维 斯 ， 卡 兰 尼 克 【Travis Kalanick ) ，Scour 网 站 和 Red Swoosh 网 站 创始 人 ， 获 麻 
省 理工 学 院 TR100 ( 《技术 回顾 》 世 界 百 名 下 年 创新 学 者 ) 称号 


“有 的 书 是 用 来 买 的 ， 有 的 书 是 用 来 藏 的 ， 还 有 的 书 是 用 来 摆 在 案头 的 。 感 谢 O "Reilly 和 Head First 的 员 
工 , 他们 出 了 最 高 等 级 的 书 一 深入 浅 出 系列 ， 让 人 爱不释手 、 百 读 不 厌 。《 深 入 浅 出 SQL》 是 我 最 


心爱 的 书 ， 连 参考 用 的 PDF 打印 稿 都 快 翻 烂 了 。 
一 比尔 - 索 耶 (Bil Sawyer) ，Oracle 公 司 ATG 课 程 经 理 


深入 浅 出 系列 图 书 美誉 
“本 书 的 透彻 、 因 默 和 害 智 令 人 钦 修 ， 连 编程 门外汉 也 能 借助 这 样 的 书 想 出 办 法 解决 问题 。” 


一 科 利 .多 克 托 罗 (Cory Doctorow ) ， 博 客 网 站 BoingBoing 授 稿 人 合作 编辑 ， 著 有 《 席 
法 王国 的 故事 》 (Down and Out in the Magic Kingdom ) 及 《人 来 人 往 的 城市 》 


( Someone Comes to Town, Someone Leaves Town ) 


“昨天 收 到 书 就 开始 读 …… 一 读 就 停 不 下 来 了 ， 真 是 酷 丝 了。 书 很 有 趣 ， 内 容 扎 实 ， 切 中 肯 繁 。 印 象 太 
好 了 。” 


一 艾 瑞 克 ' 伯 玛 (Erich Gamma ) ，IBM 赤 出 工程 是，《 设 计 模 式 》 ( Design Patterns ) 
合 著 者 


“我 读 过 的 最 有 趣 、 最 高 明 的 软件 设计 图 书 之 一 。” 


-一 其 伦 . 拉 伯 奇 (Aaron LaBerge ) ，ESPN.com 技 术 副 主席 


“过 去 要 犯 着 错误 摸索 前 进 的 漫长 学 习 过 程 ， 现 在 干净 利落 地 浓缩 在 一 本 迷人 的 平装 书 中 。” 
-一 支 克 ， 戴 维 森 (Mike Davidson ) ，Newsvine, Inc. 善 席 执 行 官 


“每 一 章 都 凝聚 着 优雅 的 设计 ， 每 一 条 原理 无 不 愧 含 实用 价值 与 闪光 智慧 。” 
一 一 上 青 ， 攻 德 斯 坦 ( Ken Goldstein ) ， 迪 斯 尼 在 线 执行 副 总 坊 


“我 罗 《深入浅出 HTML 与 CSS & XHTML》。 它 以 “有 趣 ， 的 模式 ， 将 全 部 知识 倾 囊 相 授 。” 
-一 丹 妮 尔 . 莱 维特 (Danielie Levitt ) 


“通常 ， 阅 读 设计 模式 方面 的 书 或 文章 时 ， 我 都 得 头 悬 梁 锥 刺 股 才 能 保证 注意 力 集 中 。 这 本 书 却 是 个 例 
外 ， 听 起 来 可 能 有 点 怪 ， 这 本 书 让 学 习 设计 模式 变 得 盎然 有 趣 。 


“ 当 其 他 设计 模式 方面 的 书籍 还 在 教 读者 呀 蚜 学 语 时 ， 这 本 书 却 已 在 踏 浪 高 歌 “ 加 油 ， 兄 弟 ! : " 
一 艾 维 克 ， 伍 勒 (Eric Wuehler ) | 


“我 实 实在 在 爱 这 本 书 。 事 实 上 ,我 当 着 老婆 的 面 亲 了 这 本 书 。” 
一 骞 提 斯 ， 库 玛 ( Satish Kumar ) 


O’Reilly 其 他 相关 图 书 
Statistics Hacks™ 
Statistics in a Nutshell 
Mind Hacks™ 
Mind Performance Hacks™ 


Your Brain: The Missing Manual 


O"Reilly 深 入 浅 出 系列 其 他 图 书 
Head First Java™ 
Head First Object-Oriented Analysis and Design (OOA&D) 
Head First HTML with CSS and XHTML 
Head First Design Patterns 
Head First Servlets and JSP 
Head First EJB 
Head First PMP 
Head First SQL 
Head First Programming {2008) 
Head First Design Patierns 
Head First Servlets and JSP 
Head First EJB 
Head First PMP 
Head First SQL 
Head First Programming (2008) 
Head First PHP & MySQL (2008) 
Head First Algebra (2008) 


献 给 我 的 爸 和 苞 、 妈 妈 、 大 卫 和 卡尔 。 谢 谢 你 们 的 支持 和 信任 。 
不 过 还 要 等 一 段 时 间 才 能 给 你 们 车 ! 





作者 


作者 介绍 
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(PRww Crtffttns) 


道 蚌 . 格 里 非 思 ( Dawn Griffiths ) 以 数学 家 的 身 
份 在 一 所 顶尖 英国 大 学 开始 读书 生活 ， 曾 获得 数学 专 
业 一 级 荣誉 学 位 。 可 是 ， 当 她 意识 到 人 们 在 聚会 上 不 
愿意 与 她 谈话 时 ， 就 拒绝 了 一 份 研究 极为 罕见 的 微分 
方程 的 博士 奖学金 ， 转 而 从 事 软件 开发 事业 。 目 前 她 
将 IT 咨 询 、 写 作 及 数学 集 于 一 身 。 


当道 恩 不 写 深入 浅 出 系列 图 书 的 时 候 ， 你 会 看 到 她 在 
打 太 极 源 、 织 梭 结 花 边 或 在 烹饪 美食 一 她 还 没有 修 
炼 出 一 心 三 用 的 绝技 。 旅 行 以 及 和 她 深 爱 的 丈夫 大 卫 
在 一 起 消磨 时 光 也 让 她 十 分 享受 。 


道 恩 有 一 个 猜测 一 《深入 浅 出 梭 结 花边 》 有 可 能 会 
很 火爆 ， 可 她 怀疑 布雷 特 ( Brett ) 和 劳 里 (Laurie ) 
不 会 同意 。 


褒 者 序 


《 深 人 浅 出 统计 学 》 翻 译 好 了 。 这 是 我 翻译 的 第 二 本 “ 深 人 浅 出 ”系列 书籍 ， 第 一 本 
是 《深入 浅 出 数据 分 析 》， 两 本 书 可 以 说 是 姊妹 篇 。 


《深入 浅 出 统计 学 》 具 有 深入 浅 出 系列 的 一 贯 特色 ， 即 “认为 深入 浅 出 系列 图 书 的 
每 一 位 读者 都 是 一 位 学 习 者 ”， 遵 守 “ 将 知识 图 形 化 ”、“ 采 用 对 话 式 的 个 性 化 风 
格 ”、“ 引 导读 者 深入 思考 ”、“ 牢 牢 吸 引 读 者 的 注意 力 ”、“ 影 响 读者 的 情感 ” 
等 约定 。 不 过 ， 这 并 不 意味 着 无 法 捕捉 到 作者 的 个 人 特点 。 


与 《深入 浅 出 数据 分 析 》 喧 器 错 杂 的 现场 气氛 相 比 ，《 深 入 浅 出 统计 学 》 显 示 出 一 分 
属于 “办 公 室 ” 的 宁静 ， 由 数据 分 析 师 整理 好 的 数据 就 摆 在 那里 ， 找 到 合适 的 方法 进 
行 演算 成 为 工作 的 重点 ， 这 些 方法 包括 ;信息 图 形 化 、 集 中 趋势 的 重度 、 分 散 性 与 变 
异性 的 量度 、 概 率 计算 、 离 散 概 率 分 布 、 排 列 与 组 合 、 几 何 分 布 、 二 项 分 布 及 泊 松 分 
布 、 正 态 分 布 、 统 计 抽 样 、 总 体 和 样本 的 估计 、 置 信 区 间 的 构建 、 假 设 检验 、 卡 方 分 
布 、 相 关 与 回归 。 从 开篇 至 收尾 ， 这 些 方法 由 独自 登场 到 联 被 表演 ， 从 “一 支 红 可 出 
墙 来 ”到 “ 乱 花 新 欲 迷 人 眼 ”， 徐 徐 揭 开 统计 学 神秘 的 面纱 。 作 者 充分 利用 几 个 活泼 
有 趣 的 情境 ， 淋 注 尽 致 地 发 挥 深入 浅 出 系列 “反复 阐述 ”的 特色 ， 举 重 若 轻 、 有 条 不 
率 地 完成 了 这 本 篇 幅 长 达 717 页 、 内 容 多 达 15 章 的 作品 。 


身 为 译 者 ， 我 当然 有 责任 全 力 体现 这 样 一 部 作品 的 风采 。 只 是 怎样 一 本 译作 才 是 “好 ” 
译作 ? 这 个 议论 伴随 翻译 这 个 营 生 的 生 而 生 ， 也 许 也 只 能 伴随 翻译 这 个 营 生 的 亡 才 会 
亡 。 与 其 孜孜 不 倦 地 讨论 ， 不 如 做 点 切实 的 事情 ， 向 着 “好 ”的 目标 接近 。 


在 《深入 浅 出 统计 学 》 的 翻译 过 程 中 ， 有 两 件 工作 可 以 斗 胆 请 读者 放心 : 


一 是 术语 的 翻译 。 所 有 术语 都 有 合理 出 处 ,优先 采用 的 参考 资料 是 《GBT 3358.1- 
2009 统计 学 词汇 及 符号 第 1 部 分 : 一 般 统 计 术 语 与 用 于 概率 的 术语 》。 为 了 方便 读 
者 研究 ， 现 已 将 此 标准 中 的 所 有 术语 整理 成 《GB 术语 表 》， 见 此 和 链接; http://t.en/ 
aO8viq。 除 了 少数 几 个 例外 .只 要 能 在 此 标准 中 查 到 的 术语 ， 均 优先 使 用 。 所 提 到 
的 少数 几 个 例外 则 是 为 了 成 全 表述 上 的 一 致 性 和 逻辑 性 ， 例 如 ，“range"” 一 词 ， 未 
采用 GB 中 出 现 过 的 “ 极 差 ”， 而 是 采用 其 他 资料 中 出 现 的 另 一 种 说 法 “全 距 ”， 这 
是 为 了 让 与 “range” 有 关 的 几 个 术语 一 全 虐 、 四 分 位 距 、 百 分 位 路 等 保持 和 谐 一 
致 ， 便 于 理解 和 记忆 。 


译 者 序 


二 是 标点 符号 和 字体 格式 的 认真 使 用 ;第 一 ， 统 计 术 语 首次 出 现时 加 粗 ， 凸 显 这 个 术 
语 ， 引 起 读者 重视 ; 第 二 ,统计 用 语 过 于 元 长 时 ， 为 了 加 免 这 个 用 语 与 句子 的 其 他 组 
成 成 分 混 消 不 清 ， 也 加 引号 进行 提示 ， 例 如 ， 第 4 章 第 133 页 上 的 “ 停 球 结果 为 7”; 
第 三 ， 提 高 破 折 号 的 使 用 频率 ， 当 前 后 两 个 句子 有 较为 密切 的 因果 联系 时 ， 即 使 原文 
未 使 用 夏 折 号 ， 译 文 也 改 句号 为 破 折 号 ， 以 作 提示 。 


遗憾 的 是 ， 有 极 少量 术语 无 法 做 到 既 坚 持 采 用 术语 ， 又 保持 中 文 的 流畅 。 这 固然 是 由 
于 我 个 人 经 验 不 足 、 能 力 有 限 ， 但 中 英文 的 习惯 差异 、 技 术 类 书籍 对 术语 正确 性 和 一 
致 性 的 特定 要 求 也 是 其 中 的 原因 。 例 如 ，“expect” 译 为 “期 望 ”， 可 是 ， 当 读 到 第 5 
章 中 “这 是 你 每 拉 一 次 杆 能 够 期 望 得 到 的 收益 一 是 负数 ! ”这 样 的 句子 时 ， 我 们 多 
少 会 觉得 有 些 怪异 一 在 中 文中 ， 我 们 习 馈 于 将 “期 望 ” 这 个 词 和 美好 的 前 景 联 系 在 
一 起 ， 谁 会 期 望 自己 的 收益 是 负数 ? 可 是 ， 如 果 将 “期 望 ”顺手 改 为 “预期 ”以 满足 
流畅 性 的 需要 ， 那 么 从 技术 的 严谨 性 来 看 ， 并 不 是 十 分 负责 的 做 法 。 这 样 的 词 还 有 “ 
成 功 ” 一 只 要 某 件 事情 如 期 发 生 ， 都 叫做 “成 功 ”， 无 论 好 丈 。 每 到 这 种 纠结 时 
分 ， 我 往往 按照 个 人 意愿 ， 任 性 地 坚持 “直译 ”。 囊 心 希望 这 样 的 不 足 不 会 影响 读者 
对 统计 学 的 兴趣 和 研究 。 


本 书 初稿 提交 后 ， 在 卢 轴 翔 编辑 的 热心 联络 下 ， 以 下 素 未 谋面 的 专业 人 士 参与 了 初稿 
试 读 ， 给 出 了 宝贵 的 审定 意见 ， 现 借 译 者 序 向 以 下 热心 人 士 致谢 : 


陈钢 、 高 涛 、 江 思源 、 梁 涛 、 林 字 、 刘 思 读 、 卢 涛 、 孙 强 字 、 魏 太 云 、 峰 昕 、 徐 旭 铭 、 张 伸 
最 后 ， 


感谢 电子 工业 出 版 社 、 武 汉 嘉 士 特 文化 传播 公司 对 我 的 信任 。 
感谢 卢 轴 翔 、 徐 涛 编辑 对 我 的 帮助 和 指教 。 
感谢 家 人 对 我 的 理解 和 支持 ， 我 爱 你 们 。 


李 范 
2011 年 9 月 


如 何 使 用 本 书 
序言 


真 难 以 相信 ， 他 们 竞 
把 这 些 东 西 写 进 讲 统 
计 党 的 书 里 了 . 





这 证 k 
赤 节 回答 一 个 热门 问题 者 为 什么 翡 有 
so 有 三 
把 这 此 本 西 写 进 一 本 讲 统 计 党 的 不 宇 


XXiX 


如 售 售 山本 书 


淮 透 合 阅 读本 书 ? 
请 先 回答 几 个 问题 ， 


锚 四 为 一 门 课程 、 因 为 自己 的 工作 ， 或 仅仅 因为 你 觉得 
自己 应 该 懂得 标准 差 的 意义 或 是 如 何 求 轮 盘 周 赢 钱 概 
率 ， 使 你 需要 了 解 统计 学 ? 


人 @ 你 想 学 习 、 理 解 和 记忆 如 何 使 用 概率 和 统计 百 发 百 中 
地 得 出 正确 结果 ? 


禾 与 枯燥 、 无 聊 的 学 术 演 讲 相 比 ， 你 更 喜欢 参加 充满 欢 
声 笑 语 的 晚宴 ， 对 吗 ? 


如 果 以 上 问题 全 部 回答 “对 ! ”- 一 这 本 书 适 合 你 。 
准 恋 和 本 书 说 释 释 ? 
请 先 回答 几 个 问题 : 


B 你 从 来 没有 学 过 基础 算术 ? ( 不 用 很 精通 ， 但 应 该 会 
基本 的 加 、 减 、 乘 、 除 。) 


敌 。 你 是 一 位 意气 风 发 的 统计 师 ， 正 在 物色 参考 书 ? 


锚 。 你 惧怕 尝试 新 事物 ， 宁 可 上 山 打 虎 也 不 愿 标新立异 ， 
对 吗 ? 你 认为 要 是 用 拟人 的 手法 叙述 维 恩 图 ， 统 计 学 
书籍 就 难免 有 失 严肃， 对 吗 ? 





只 要 有 一 个 问题 回答 “对 1 ” 
你 与 本 书 无 缘 。 





[营销 部 撒 话 一 - 必要 寿 信 
用 卡 就 可 以 买书 嘻 .] 


XXX ”深入 浅 出 统计 学 


序言 


我 们 了 解 你 在 想 什 么 
“这 怎么 能 是 一 本 严肃 的 统计 学 书籍 呢 ? ” 
“这 些 图 都 是 用 来 干 嘛 的 ? ” 


“我 真能 这 样 学 统计 学 吗 ? 你 痊 大 及 沉 把 
这 很 重要 


我 们 了 角 你 的 大 脑 在 想 什 么 
你 的 大 脑 淘 望 新 事物 。 大 脑 总 是 不 停 地 搜索 、 探 查 、 等 待 不 同 寻 常 的 事 
物 ， 它 天 生 如 此 ， 这 正 是 你 活力 的 来 源 。 

那么 ,大脑 怎么 对 待 你 所 碰 到 的 常规 、 普 通 、 一 般 的 事情 呢 ? 一 它 
会 竭尽 全 力 阻止 这 些 事 情 ， 以 免 干扰 自己 真正 的 工作 一 记录 重要 事 
项 。 大 脑 不 会 费力 保存 这 些 琐事 ， 这 些 琐事 从 来 不 会 成 功 地 间 过 “ 明 
显 不 重要 事项 ”关卡 。 

你 的 大 脑 如 何 知道 哪 件 事 重 要 ? 假想 有 一 天 你 出 门 旅行 ， 迎 面 扑 来 一 只 
吊 睛 白 额 大 虫 ， 你 的 头脑 和 身体 会 有 什么 反应 ? 

神经 元 发 动 、 情 绪 激动 、 化 学 物质 激增 。 于 是 ， 你 的 大 脑 知道 一 

这 事 绝对 重要 ! 记 住 ! 

但 ， 想 象 你 是 有 呆 在 家 里 ， 或 是 呆 在 图 书馆 里 ， 也 就 是 说 ， 是 在 一 
个 安 人 全、 温暖、 没有 老虎 的 地 方 。 

你 正在 复习 迎 考 ， 要 不 然 就 是 在 努力 搞 懂 一 些 艰 深 的 技术 ， 你 的 
老板 认为 花 个 把 星期 就 能 搞定 ， 顶 多 十 天 。 

唯一 的 问题 是 : 你 的 大 脑 想 好 好 帮 你 一 把 ， 它 试图 保证 不 让 这 
种 “明显 不 重要 ”的 内 容 去 破坏 珍惜 的 资源 ， 这 些 珍 稀 的 资源 
最 好 用 来 保存 真正 “重大 ”的 事情 ， 像 老虎 啊 ， 像 火灾 险情 啊 ， 
像 你 绝 不 该 在 Facebook 的 网 页 上 贴 上 那些 “聚会 ”照片 啊 。 
没有 什么 方便 的 办 法 可 以 告诉 大 脑 “ 喂 ， 大 脑 ， 我 对 你 感激 之 
至 ， 可 是 不 管 这 本 书 多 无 聊 ， 也 不 管 我 对 这 本 书 多 没 兴趣 ， 我 
真 的 想 把 这 些 东 西 全 都 记 住 。” 






行 啊 。 才 未 过 700 多 











序言 ”如 何 使 用 这 本 书 。 xxxi 


如 何 使 用 本 书 


我 们 认为 深入 浅 出 (Head First) 系列 

图书 的 每 一 位 读者 都 是 一 位 学 习 者 。 
既然 要 学 习 ， 怎 样 才能 学 会 呢 ? 首先 ， 你 得 搞 懂 ， 然 后 ， 切 勿 遗忘 。 一 字 一 句 硬 塞 不 是 
办 法 。 根 据 最 新 的 认 知 科学 、 神 经 生物 学 及 教育 心理 学 研究 结果 ， 学 习 远 不 仅仅 是 读书 
认 字 。 我 们 知道 怎么 让 你 的 脑筋 动 起 来 。 


下 面 是 部 分 深入 浅 出 ( Head First ) 教学 原则 : 


将 知识 图 形 化 。 图 形 比 单调 的 文字 好 记得 多 ， 可 以 提高 学 习 效 率 ( 记忆 学 习 和 转移 学 习 
的 学 习 效 率 最 多 能 提高 89% ) ; 图 形 还 能 让 知识 更 容易 理解 ， 相 比 将 文字 放 在 页 
脚 和 下 一 页 ， 将 文字 放 在 相关 图 形 当中 或 图 形 周 围 ， 学 习 者 成 功 解决 相关 

问题 的 可 能 性 将 成 倍增 长 。 


采用 对 话 式 的 个 性 化 风格 。 最 近 EUR 
的 研究 表明 ， 要 是 回避 一 本 正经 的 语气 ， 我 们 是 到 不 事件 

代 之 以 对 话 般 的 风格 ， 以 第 一 人 称 平易 近 人 地 给 学 生 上 课 ， 学 

生 的 课 后 测验 成 绩 最 多 可 提高 40% 。 多 讲 几 个 故事 ， 少 来 

点 高 谈 阔 论 ， 语 气 宜 随和 。 别 太 郑重 其 事 。 想 想 看 ， 一 局 欢声 

笑语 的 晚 宣 ， 或 是 一 场 枯燥 的 演讲 ， 哪 一 样 更 让 你 感 兴趣 ? 


引导 读者 深入 思考 : 换 句 话说 ， 除 非 读 者 主动 调动 自己 的 神 
经 元 ， 否 则 脑袋 里 不 会 发 生 什么 大 变化 。 只 有 激发 读者 的 兴 
趣 ， 引 起 读者 的 好 奇 ， 刺 激 读者 的 灵感 ， 读 者 才能 解决 问题 ， 
得 出 结论 ， 获 得 新 知识 。 为 此 ， 讲 授 者 要 设计 各 种 难题 、 练 习 ， 提 出 引 人 深 思 的 
提问 ， 还 要 多 设计 一 些 让 左右 脑 半 球 和 多 种 感官 都 动 起 来 的 活动 。 


牢 牢 吸引 读者 的 注意 力 。 大 家 都 有 这 样 的 体验 一 “我 是 真 想 学 ， 但 看 完 

第 一 页 就 巡 了 ”。 大 脑 注意 的 是 不 同 寻常 的 、 有 趣 的 、 奇 怪 的 、 引 人 注 

意 的 、 出 人 意料 的 事情 。 学 习 一 种 新 颖 艰深 的 技术 不 一 定 非得 枯燥 乏味 不 
可 ， 果 真有 了 吸引 注意 力 的 内 容 ， 大 脑 会 学 得 更 快 。 


影响 读者 的 情感 。 现 在 我 们 知道 ， 人 的 记忆 能 力 在 很 大 程度 上 取 

决 于 要 记忆 的 内 容 对 情感 的 影响 。 我 们 关心 什么 ， 就 会 记 住 什么 ，; 

我 们 对 什么 事 有 感觉 ， 就 会 记 住 什么 。 这 里 讲 的 情感 并 非 天 灾 

人 祸 给 人 带 来 的 撕 心 裂 肺 的 伤 痛 情 感 ， 而 是 惊讶 、 好 奇 、 感 觉 有 趣 、 想 追根 究 

底 之 类 的 情感 ， 以 及 在 猜 对 一 个 字谜 、 在 学 会 别人 感觉 难以 学 会 的 事情 或 是 在 

意识 到 自己 懂 的 东西 居然 比 工程 部 那 位 开口 闭口 “我 比 你 有 技术 ”的 张 三 还 多 
时 ， 油 然而 生 的 “我 是 老大 ”的 感觉 。 
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元 认 知 : 对 思考 的 思考 


如 果真 想 学 东西 ， 而 且 想 学 得 更 快 更 深入 ， 就 要 关注 自己 如 何 集中 注意 RE 
力 。 要 思考 自己 的 思考 方式 ， 研 究 自己 的 研究 方式 。 我 的 大 脑 记 伍 这 此 


大 多 数 人 在 成 长 过 程 中 都 不 曾 学 习 元 认 知 和 学 习 理 论 方面 的 知识 。 人 们 期 资料 . 
望 我 们 学 知识 ， 但 极 少 有 人 教 我 们 如 何 学 


但 想象 得 到 ， 捧 着 本 书 的 你 ， 的 确 想 学 习 统计 学 知识 ， 同 时 可 能 不 想 花 费 
太 多 时 间 。 要 想 利用 在 本 书 中 读 到 的 知识 ， 就 得 记 住 读 过 的 知识 ， 为 此 
必须 理解 这 些 知 识 。 为 了 淋漓 尽 致 地 发 挥 本 书 或 任何 书本 或 学 习 经 验 的 作 
用 ,请 管 好 你 的 大 脑 ， 请 管 好 大 脑 对 待 本 书 的 态度 。 

诀窍 在 于 让 大 脑 把 正在 学 习 的 新 资料 当做 “正经 大 事 ” 一 -对 幸福 至 关 
重要 的 大 事 ， 像 面 对 老虎 一 样 重要 的 大 事 。 若 非 如 此 ， 你 就 会 陷入 一 场 
持久 战 : 你 竭力 要 记 住 新 知识 ， 大 脑 却 竭力 要 把 这 些 新 知识 踢 出 去 。 
既然 如 此 ， 如 何 让 大 脑 像 对 待 吃 人 的 老虎 一 样 对 待 统计 学 知识 呢 ? 
有 两 种 办 法 ， 一 种 缓慢 而 乏味 ， 一 种 迅速 而 有 效 。 慢 办 法 是 简单 记 
忆 。 你 显然 明白 ， 只 要 不 停 地 把 同样 的 东西 往 大 脑 里 灌 ， 即 使 是 最 
乏味 的 知识 ， 也 能 学 会 、 记 牢 。 只 要 重复 灌 的 次 数 足够 多 ， 大 脑 就 会 想 : “这 些 东西 
给 他 的 感觉 并 不 重要 ， 但 他 不 停 地 看 这 些 相同 的 东西 ， 一 - 遍 ， 一 遍 ， 再 一 遍 。 因 此 我 
猜 这 些 东西 肯定 很 重要 。” 


快 办 法 是 做 一 切 增进 大 脑 活动 的 事 ， 尤 其 是 不 同类 型 的 大 脑 活动 。 上 一 页 讲 了 很 多 
这 样 的 活动 ， 事 实证 明 ， 这 些 活动 全 都 能 促使 大 脑 以 有 利于 已 的 方式 工作 。 例 如 ， 
研究 表明 ， 将 文字 放 在 文字 所 描述 的 图 片 当中 ( 相反 的 做 法 是 将 文字 放 在 页 面 中 的 
其 他 位 置 ， 如 注释 位 置 或 正文 位 置 ) ， 会 促使 大 脑 努力 想 搞 清楚 文字 和 图 片 之 间 的 
关系 ， 进 而 发 动 更 多 神经 元 。 更 多 神经 元 发 动 = 更 有 机 会 让 大 脑 明 白 某 件 事 值 得 注 
意 ， 可 能 还 值得 记 住 。 

对 话 式 的 写作 风格 对 此 很 有 帮助 。 人 们 在 与 人 对 话 时 注意 力 会 更 集中 ， 原 因 是 别人 
期 待 对 方 有 所 表现 。 令 人 惊讶 的 是 ， 大 脑 不 一 定 会 在 意 “ 对 话 ” 是 在 人 和 书 之 间 进 
行 ! 反之 , 要 是 写作 风格 了 无 新 意 ， 乏味 枯燥 ， 大 脑 的 感觉 就 和 在 挤 满 消极 听众 的 
屋子 里 听 演 讲 没什么 两 样 : 没 必要 保持 清醒 。 


不 过 ， 图 形 和 对 话 式 风格 只 是 起 步 …… 
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如 何 使 用 本 书 


我 们 的 做 法 : 

我 们 使 用 丰富 的 图 片 ， 这 是 因为 ,大脑 追 逐 图 像 ， 而 非 文字 。 在 大 脑 的 活动 中 ， 一 张 图 
片 胜 过 千言 万 语 。 当 同时 使 用 图 片 和 文字 进行 说 明 时 ,我 们 将 文字 填写 在 图 片 当中 ， 当 
文字 出 现在 它 所 描述 的 事物 当中 时 ， 大 脑 的 工作 更 有 效率 ; 相反 ， 若 将 说 明 性 文字 放 在 
注释 或 其 他 正文 当中 ， 则 无 此 效果 。 

我 们 使 用 反复 论述 法 ， 即 以 不 同 的 方式 、 通 过 不 同 的 媒介 对 同一 主题 进行 反复 描述 ， 给 
读者 营造 丰富 的 感受 ， 目 的 是 让 这 些 主题 有 更 多 机 会 印 在 大 脑 的 多 个 区 域 。 

我 们 以 出 人 意料 的 方式 叙述 概念 和 使 用 图 片 ， 因 为 ， 大 脑 追 逐 新 鲜 事 物 ; 我 们 在 图 片 和 
创意 中 或 多 或 少 加 入 了 一 些 情感 性 的 内 容 ， 因 为 ， 大 脑 关注 情感 的 生物 化 学 反应 。 让 
人 有 所 感触 的 东西 更 可 能 让 人 记 住 ， 即 使 这 点 感触 不 过 是 一 丝 幽 默 、 一 丝 惊讶 或 一 丝 兴 
趣 ， 也 是 如 此 。 


我 们 使 用 个 性 化 的 对 话 式 写作 风格 ， 因 为 ， 当 大 脑 认为 你 是 在 进行 对 话 而 不 是 在 消极 地 
听 报 告 时 ， 就 会 调整 到 注意 力 更 集中 的 状态 。 即 使 在 读书 时 ， 大 脑 也 是 这 个 习惯 。 


我 们 安排 了 80 多 个 活动 ， 因 为 ， 相 比 读书 ， 在 做 事 时 ， 大 脑 经 过 调整 ， 能 学 会 和 记 住 更 多 
东西 。 我 们 安排 的 练习 有 难度 ， 但 不 会 让 人 束手无策 ， 这 正 是 大 多 数 人 愿意 做 的 练习 。 


我 们 使 用 多 种 教学 风格 ， 因 为 ， 有 的 人 可 能 喜欢 一 步 一 步 按 顺序 来 ， 有 的 人 可 能 喜欢 先 
看 慌 大 图 ， 还 有 一 些 人 可 能 只 想 看 看 例子 。 我 们 将 以 多 种 方式 反复 讲述 相同 的 主题 ,不 
管 读者 的 个 人 爱好 如 何 ， 都 将 因此 受益 菲 浅 。 


我 们 安排 了 让 左右 脑 半 球 分 别 负 责 的 内 容 ， 因 为 ， 大 脑 开 动 部 位 越 多 ， 就 学 得 越 多 ， 记 
得 越 多 ， 注意 力 更 持久 。 由 于 一 侧 大 脑 工作 往往 意味 着 另 一 侧 大 脑 得 到 休息 左右 半 脑 
的 分 工 合作 使 得 长 时 间 学 习 的 学 习 效率 得 到 提高 。 

我 们 还 安排 了 一 些 场景 和 练习 ， 在 场景 中 展现 不 同 的 观点 ， 因 为 ， 当 大 脑 被 迫 进行 评估 
和 判断 时 ， 会 调整 到 深入 学 习 状 态 。 

我 们 在 练习 中 安排 了 一 些 难点 ， 即 提出 一 些 无 法 简单 回答 的 问题 。 因 为 ， 你 的 大 脑 在 不 得 
不 处 理 某 件 事情 时 ， 会 调整 到 学 习 和 记忆 状态 。 开 动脑 筋 吧 ，“ 光 看 别人 做 运动 无 法 让 自 
己 体态 健美 ”。 别 担心 ,我们 尽力 保证 ， 你 努力 学 习 的 都 是 该 学 的 ， 你 不 会 为 了 对 付 一 个 
费解 的 例子 或 为 了 分 析 一 段 用 词 过 于 上 涩 或 行文 过 于 简化 的 段落 而 多 用 一 个 脑 细胞 。 

我 们 以 人 物 为 例 ， 把 人 物 安排 在 场景 、 实 例 、 图 片 等 等 内 容 中 。 至 于 原因 嘛 ， 因 为 你 是 人 
群 中 的 一 员 啊 ， 你 的 大 脑 对 人 比 对 事 更 关注 。 
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生字 孝 据 了 
5 
4 
3 
2 
1 









= 


重要 统计 旺 





二 把 它 前 下 来 
贴 在 冰箱 上 。 





贸 但 慢 读 。 理 解 的 内 容 越 多 ， 要 记忆 的 内 容 越 少 。 
忌 死 读 。 停 一 停 ， 想 一 想 ， 碰 到 书 中 的 提问 
时 ， 别 直接 翻 看 答案 ; 想象 真 的 有 人 在 问 你 
这 个 问题 。 强 迫 自己 的 大 脑 想 得 越 深 ， 学 会 
记 住 的 概率 就 越 大 。 


仿 自己 做 练习 ， 自 己 记 笔记 。 
我 们 安排 了 练习 和 笔记 ,但 是 ， 要 是 我 们 普 
你 完成 ， 就 像 让 别人 蔡 你 锻炼 身体 一 样 。 只 
动 腿 不 动手 也 不 可 取 ， 要 动 动笔 。 大 量 证 据 
证 明 ， 学 习 时 的 身体 动作 能 提高 学 习 效 率 。 


仿 阅读 “世上 没有 傻 问题 ”部 分 
世上 没有 使 问 题 。 这 些 问题 并 非 可 看 可 不 看 、 
这 是 核心 内 容 的 组 成 部 分 ! 请 勿 忽略 。 


多 请 格 下 面 这 忆 话 作为 最 后 一 段 床 头 文字 ， 或 起 码 作 
为 最 后 一 段 高 深 的 床 头 文字 。 
有 一 部 分 学 习 过 程 (尤其 是 短暂 记忆 转变 为 长 期 
记忆 的 过 程 ) 发 生 在 放下 书本 之 后 ， 大 脑 需要 有 
自己 的 时 间 进 行 更 多 处 理 。 如 果 在 这 段 处 理 时间 
内 学 新 东西 ,将 会 丢失 一 些 刚 学 会 的 东西 。 


入 大 水 。 
充沛 的 体液 会 让 大 脑 处 于 最 佳 工 作 状 态 ， 脱 
水 ( 早 在 感到 口 淘 前 就 会 发 生 ) 则 会 让 认 知 
功能 下 降 。 


序 营 


你 的 任务 : 征服 大 脑 

我 们 的 工作 到 此 为 止 ， 剩 下 的 就 看 你 的 了 。 从 下 面 这 些 
提示 出 发 ， 顺 从 大 脑 的 判断 ， 看 看 哪些 对 你 有 用 ， 哪 此 
对 你 没 用 ， 尝 试 一 下 新 事物 吧 。 


Ly) 开口 大 声讨 论 。 


说 话 会 刺激 大 脑 的 其 他 部 分 。 如 果 你 正在 努力 理解 
一 些 知识 ， 或 正在 努力 增加 以 后 记 住 这 些 知 识 的 概 
率 ， 请 大 声 说 出 这 些 知识 。 还 有 一 种 更 好 的 做 法 ， 
试 着 向 别人 大 声 解释 这 些 知识 。 你 会 学 得 更 快 ， 可 
能 还 会 发 现 一 些 阅读 时 不 曾 发 现 的 名 堂 。 


纺 脸 听 大 大 的 声音 。 


留意 你 的 大 脑 是 否 超 负荷 工作 。 若 你 发 现 自己 开 
始 心 不 在 瑞 ， 或 是 刚刚 读 过 的 东西 转眼 忘记 ， 就 
该 休息 。 一 旦 过 了 某 个 学 习 点 ， 哪 怕 拼 命 塞 ， 也 
无 法 提高 学 习 效 率 ， 反 而 有 可 能 影响 学 习 过 程 。 


找到 感觉 。 

大 脑 带 要 知道 事情 是 否 重 要 。 让 自己 融和 人 各 种 
场景 ， 为 照片 设想 旁 注 ， 就 连 抱 她 一 个 并 不 好 
笑 的 玩笑 ， 也 比 什 么 感觉 都 没有 强 。 

勤 加 练习 ! 

完全 掌握 统计 学 的 唯一 办 法 就 是 勤 加 练习 ， 本 书 通 
篇 都 在 引导 你 这 样 做 。 统 计 学 的 运用 是 一 门 技术 ， 
精 于 此 道 的 唯一 办 法 就 是 大 量 练 习 。 本 书 将 为 你 提 
供 大 量 练习 机 会 : 每 一 章 中 都 有 一 个 等 待 你 解决 的 
问题 ， 千 万 别 跳 过 这 些 问 题 不 看 一 大 量 学 习 都 发 
生 在 解决 问题 的 过 程 中 。 我 们 为 每 一 个 问题 提供 了 
答案 ， 要 是 卡 了 壳 (有些 细 微 之 处 很 容易 给 人 带 来 
麻烦 ) ， 别 不 敢 看 ! 不 过 ,请 尽量 先 解决 问题 ， 然 
后 再 看 答案 ,务必 让 你 的 办 法 行 之 有 效 ， 然 后 才 继 
续 看 书 中 的 下 一 部 分 内 容 。 
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本 书 是 经 验 之 淡 ， 并 非 系 统 教材 ， 我 们 故意 抽 挤 了 会 妨碍 讲述 书 中 相关 知识 的 东西 。 
本 所 对 你 已 经 见识 过 和 学 匀 过 的 知识 作 了 一 些 假设 ， 因 此 第 一 次 通读 本 书 的 时 候 ， 需 
要 从 头 读 起 。 


我 们 从 数据 展示 和 汇总 的 基本 方法 讲 起 ， 讲 至 概率 分 布 ， 再 讲 至 假设 检验 等 其 他 高 级 
应 用 技术 。 


尽管 越 往 后 的 章节 越 重 要 ,但 起 始 部 分 却 是 后 文 的 基石 、 图 表 绘 制 、 均 值 计算 ， 以 及 
变异 性 的 量度 均 在 此 列 。 因 此 ， 我 们 一 开始 就 抛 给 你 一 些 基 本 统计 问题 ， 这 些 问 题 其 
实 是 靠 你 自己 解决 的 。 如 此 一 来 、 你 就 能 立刻 把 统计 学 用 起 来 ， 你 将 开始 摩拳擦掌 。 
在 此 之 后 .我 们 继续 向 你 讲解 概率 和 概率 分 布 的 运用 ， 这 时 你 将 打下 坚实 的 统计 学 基 
础 ， 可 以 专心 于 学 习 概 念 。 接 着 ， 我 们 讲解 如 何 挥洒 自如 地 运用 所 学 知识 ， 假 设 检验 
就 是 一 例 。 我 们 瞒 准 时 机 为 你 提供 合适 的 知识 ， 这 样 的 知识 最 有 价值 。 


我 们 所 讲 范围 与 AP 与 A Level 的 常规 范围 相同 。 


尽管 我 们 的 关注 重点 是 全 面 学 习 而 非 考试 准备 ， 但 我 们 很 好 地 纳 人 了 AP 和 A Level 课 程 的 
内 容 ， 因 此 ， 随 着 对 本 书 的 学 习 ， 你 将 深入 领会 各 种 等 级 考试 的 应 知 应 会 内 容 ， 通 过 这 
种 方法 学 习 统 计 学 比 死 记 硬 背 公式 效果 更 好 ， 因 为 你 对 于 自己 的 需要 充满 自信 ， 你 知道 
什么 时 候 需 要 使 用 这 些 知识 ， 知 道 如 何 使 用 这 些 知识 。 


我 们 通过 在 线 资源 为 你 提供 帮助 。 


通过 与 读者 交流 ， 我 们 得 知 你 有 时 候 希 要 一 些 特别 的 帮助 ， 因 此 我 们 提供 了 一 些 在 线 
资源 、 动 动 指 尖 就 能 访问 。 我 们 为 你 提供 互动 在 线 论坛 、 在 线 论文 及 其 他 资源 。 请 从 
这 里 开始 访问 : 

http://www.headfirstlabs.com/books/hfstats/ 
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活动 间 非 可 做 可 不 做 。 


练习 和 活动 不 是 点 绥 ， 而 是 本 书 的 核心 组 成 部 分 。 这 些 练习 和 活动 有 的 是 为 了 帮助 
记忆 ， 有 的 是 为 了 帮助 加 深 理 解 ， 还 有 的 是 为 了 帮助 应 用 所 学 知识 ， 切 缴 忽 略 。 唯 
一 的 例外 是 填 字 游戏 ， 这 不 是 非 做 不 可 ， 不 过 ,， 填 字 游戏 会 让 大 脑 得 到 在 不 一 样 的 
语 境 下 思考 所 学 到 的 单词 和 术语 的 大 好 机 会 。 


反复 论述 是 刻意 而 重要 的 安排 。 


深入 浅 出 系列 书籍 有 一 个 明显 特色 : 我 们 希望 你 “真正 ”掌握 学 到 的 知识 ， 我 们 希 
望 你 在 看 完 本 书 的 同时 就 记 住 学 到 的 知识 。 大 和 多数 参考 书 都 不 把 记忆 和 回忆 当做 一 
个 目标 , 但 本 书 的 目标 是 “学 会 ”， 所 以 ， 常 常会 看 到 同一 概念 多 次 出 现 。 


“ 动 动脑 ”练习 没有 答案 。 


有 一 些 “ 动 动脑 ”练习 没有 标准 答案 ， 另 有 一 些 练习 是 为 了 让 你 判断 自己 的 答案 是 
否 正确 ， 以 及 在 什么 情况 下 会 正确 。 部 分 “ 动 动脑 ”练习 给 出 了 提示 ， 为 你 指明 正 
确 方 向 。 
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大 脑 对 待 统计 学 的 态度 。 一 边 是 你 努力 想 学 会 一 些 知识 ， 一 边 是 你 的 大 脑 


忙 着 开小差 。 你 的 大 脑 在 想 : 


“最 好 把 位 置 留 给 更 重要 的 事 ， 像 该 离 哪 些 


野生 动物 远 点 啊 ， 像 光 着 身子 滑雪 是 不 是 个 坏 点 子 啊 。” 既 然 如 此 ， 你 该 


如 何 引 透 你 的 大 脑 意识 到 ， 懂 得 统计 学 是 你 安身 文 命 的 根本 ? 
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信息 图 形 化 


在 为 手头 数据 无 法 给 出 事情 真相 而 发 硫 吗 ? 统计 能 化 繁 为 简 ， 帮 助 你 
让 一 堆 堆 令 人 困惑 的 数据 发 挥 作用 。 当 你 发 现 数据 的 真相 后 ， 接 下 来 就 
需要 借助 可 视 化 的 方法 表现 出 来 ， 使 之 公之于众 。 为 了 找到 最 合适 的 图 
表 完 成 这 个 过 程 ， 请 你 整理 衣衫 ， 带 上 最 好 的 计算 尺 ， 和 我 们 一 起 赶 
往 “ 统 计 郑 ” 吧 。 
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【 沁 剖 可 到 省 让 


统计 量 无 处 不 在 

为 何 学 习 统计 学 ? 

从 两 张 图 说 起 

果 板 的 饼 图 

条 形 图 更 具 精 确 性 
垂直 条 形 图 
水 平 条 形 图 

标 度 的 影响 力 
使 用 频数 标 度 

处 理 儿 批 数据 
类 别 与 数字 

处 理 分 组 数据 

绘制 直方 图 起 步 : 求 出 长 方形 宽度 
第 1 步 : 求 长 方形 宽度 
第 2 步 : 求 长 方形 高 度 
第 3 步 : 画 出 直方 图 
认识 累积 频数 

绘制 累积 频数 图 
选择 正确 的 图 形 


7 月 #8 有 月 9 月 10 彤 11 问 12 月 


目录 


集中 趋势 的 量度 


中 良 之 道 


有 时 候 ， 把 握 问 题 核心 才 是 当务之急 。 从 一 大 堆 数 字 中 看 出 模式 和 趋势 可 能 
为 不 易 ， 而 求 出 平均 数 往往 是 把 握 全 局 的 第 一 步 。 有 了 平均 数 就 能 迅速 找 出 数 
据 中 最 具 代表 性 的 数值 ， 得 出 重要 结论 。 在 本 章 中 ， 我 们 将 介绍 几 种 方法 ， 帮 
助 你 计算 最 重要 的 统计 量 -一 均值 、 中 位 数 、 众 数 。 你 将 开始 学 习 如 何 有 效 地 
汇总 数据 ， 尽 可 能 得 出 简练 、 有 用 的 结果 。 
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用 概率 预测 长 期 结果 ， 以 及 如 何 量度 这 些 预测 结果 的 确定 性 。 
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结果 的 烦恼 。 来 吧 ， 让 我 们 看 看 如 何 计算 概率 。 
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几何 分 布 、 二 项 分 布 及 泊 松 分 布 
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计算 概率 分 布 颇 为 费时 。 前 面 讲 到 如 何 计算 和 利用 概率 分 布 ， 不 过 ， 如 果 方 法 更 
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有 时 候 样本 无 法 给 出 足够 正确 的 结果 。 前 面 讲 到 如 何 用 点 估计 量 估计 总 体 均 值 、 方 
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种 估计 总 体 统 计量 的 方法 一 一 种 考虑 了 不 确定 性 的 方法 。 拿 出 你 的 概率 表 ， 我 们 
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X 分 布 

继续 探讨 …… 

有 时 候 事 实 与 期 望 并 不 相符 。 当 以 一 种 特定 的 概率 分 布 为 某 种 情况 建 模 时 ， 对 
于 事物 的 长 期 可 能 结果 ， 你 有 十 分 清晰 的 想法 。 可 如 果 期 望 与 事实 存在 差别 
呢 ? 你 该 如 何 判 断 ? 一 -这 些 偏差 是 正常 波动 ， 还 是 说 明 概 率 模型 存在 问题 ? 本 
章 将 讲解 如 何 利 用 Xx’ 分 布 分 析 结 果 ， 排 除 可 疑 结果 。 
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我 起 打 持 得 重生 净 净 、 泽 漂亮 
亮 ， 给 人 留 下 将 印象 . 


在 为 手头 数据 无 法 给 出 事情 真相 而 发 愁 吗 ? 


统计 能 化 繁 为 简 ， 帮 助 你 让 一 堆 堆 令 人 困惑 的 数据 发 挥 作用 。 当 你 发 现 
数据 的 真相 后 ， 接 下 来 就 需要 借助 可 视 化 的 方法 表现 出 来 ， 使 之 公 之 于 
众 。 为 了 找到 最 合适 的 图 表 完 成 这 个 过 程 ， 请 你 整理 衣衫 ， 带 上 最 好 的 
计算 尺 ， 和 我 们 一 起 赶 往 “ 统 计 邦 ” 吧 。 


进入 新 的 篇 童 1 


欢迎 来 到 统计 邦 ! 


统计 无 处 不 在 


网 页 浏览 、 运 动 竞技 、 游 戏 排名 ， 但 凡人 们 目光 所 及 ， 处 处 篆 有 统计 量 。 
然而 ， 究 竟 何 为 “统计 ”? 

统计 是 这 样 一 些 数字 : 它们 通过 某 种 有 意义 的 方式 对 原始 事实 和 数字 进行 
提炼 ， 使 得 仅仅 通过 观察 原始 数据 无 法 立即 水 落石 出 的 一 些 理念 得 以 昭示 。 
这 里 的 数据 指 的 是 我 们 能 够 据 其 做 出 结论 的 事实 或 数字 。 例 如 ， 若 你 只 想 
知道 自己 心爱 的 球 队 在 联赛 中 排名 如 何 ， 大 可 不 必 辛 辛苦 苦 地 过 目 诸多 赛 
事 的 得 分 记录 ， 只 需 一 个 统计 量 ， 就 能 立即 得 到 所 需要 的 信息 。 


对 统计 的 研究 包括 : 统计 数据 的 来 源 、 计 算 方法 及 有 效 使 用 方法 并 得 出 


搜集 数据 站 数据 的 方法 包括 : 查看 现 有 
一 数据 源 、 做 实验 或 做 调查 。 






按 集 到 数据 后 ， 就 能 进行 分 折 

生出 统计 量 ， 你 可 以 计算 事件 上 
年， 预测 发 生 某 些 事件 的 可 能 全 
也 可 以 了 解 某 些 结果 的 可 信 符 


完成 数据 分 析 后 ， 融 
可 以 下 结论 、 作 预测 . 一 一 也 





2 深入浅出 统计 学 


第 一 印象 


本 有 

为 何 学 匀 统计 党 ? 

此 助 统计 方法 了 解 事实 真相 会 令 你 能 力 过 人 ， 身 手 不 凡 。 只 要 得 到 可 靠 
的 统计 量 ， 就 能 作出 客观 的 决策 ， 如 有 神助 地 进行 精确 地 预测 ， 以 及 以 
最 有 效 的 方式 传达 自己 想 传达 的 信息 


统计 可 以 成 为 提炼 数据 本 质 的 一 件 法 宝 ， 然 而 也 有 和 需 小 心 提防 之 处 


°F 


N 














你 可 以 借助 
统计 说 出 你 想 要 的 
结果 ， 基 或 搬 下 谎言 


你 可 以 借助 统计 说 明 
世界 有 多 奇妙 。 






统计 以 事实 为 基础 ， 尽 管 如 此 ， 有 时 却 具 有 误导 性 。 利 用 统计 ， 既 可 以 
昭 告 事实 ， 也 可 以 瞒天过海 。 问 题 是 ， 如 何 才能 判别 自己 所 获悉 的 是 事 
实 ， 亦 或 是 谎言 ? 

好 好 掌握 统计 学 将 会 使 你 处 于 有 利 地 位 ， 你 将 拥有 更 好 的 手段 去 判断 统计 
量 是 否 出 错 或 产生 了 误导 。 换 句 话 说， 学 习 统计 学 是 避免 遭 人 思 弄 的 良策 
请 看 实例 : 某 公 司 去 年 下 半年 盘 利 情况 。 














利 洞 保持 稳定 
可 这 没什么 特别 . 


对 同一 批 数 据 为 何 会 有 两 种 说 法 ?让 我 们 仔细 看 看 
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数据 的 差异 表现 


从 两 张 周 说 起 


我 们 该 怎么 探讨 针对 同一 批 数据 的 这 两 种 不 同 解释 呢 ? 一 我 们 需要 用 某 
种 方式 直观 地 表现 这 些 数 据 。 说 到 信息 的 直观 表现 形式 ， 最 好 的 方法 莫 过 
于 图 表 。 图 表 是 概括 原始 信息 的 便捷 方式 ， 能 帮助 你 一 眼 得 出 初步 印象 
不 过 要 小 心 ， 即 使 最 简单 的 图 表 也 能 神 不 知 鬼 不 觉 地 迷惑 你 、 误 导 你 


下 面 这 两 张 图 体现 了 某 公 司 6 个 月 的 赢利 情况 。 它 们 都 以 相同 的 信息 为 基础 ， 
为 什么 外 观 差别 如 此 之 大 呢 ? 一 它们 以 大 相 径 庭 的 形式 演绎 同一 信息 






公司 每 月 利润 
2.5 明 乌 我 的 意思 了 吧 ， 
利 20 ee aq DO 【、 利 调 几乎 月 月 系 度 。 
润 2 
百 15 
元 


0.0 
7 月 8 月 9 月 10 月 11 月 12 月 . 


月 份 
而 张 图 都 以 同一 信息 为 基础 ， 欠 
讽 却 大 相 径 府 ， 文 是 直人 么 叫 下 1 
公司 每 月 利润 
2.5 
利 2.4 
润 
3 "3 
2 
美 
2 
2.0 





7 月 8 月 9 月 10 月 11 月 12 月 
月 份 


4 ”深入浅出 统计 学 


第 一 印象 


观察 前 一 页 的 两 张 图 。 你 觉得 主要 区 别 在 哪里 ? 为 什么 这 两 张 
图 会 让 人 对 数据 形成 如 此 不 同 的 第 一 印象 ? 





世上 没有 公 问题 


问 : 为 什么 不 直接 观察 数据 ? 干 凡 要 用 图 形 表 示 ? 


阅 : 信息 与 数据 有 何 区 别 ? 


答 : 有 时 候 只 看 原始 数据 无 法 明白 就 里 ， 数 据 中 隐 答 : “数据 ” 指 的 是 所 搜集 的 原始 事实 与 数字 。“ 信 


含 着 一 些 寞 式 和 趋势 ， 仅 仅 观察 堆积 如 山 的 数字 很 难 把 
握 这 些 模式 和 趋势 。 图 形 是 发 现 玫 据 隐 含 模式 的 一 种 有 
效 方 法 。 通 过 图 形 ，、 教 据 得 以 直观 地 体现 ， 使 你 一 眼 就 
能 看 出 数据 的 真正 动向 - 


息 ” 指 的 是 加 入 了 某 种 意义 的 数据 。 

以 数字 5、6、7 为 例 ， 单 看 它们 本 身 ， 它 们 只 不 过 是 一 些 
数字 ， 你 并 不 知道 这 些 数字 有 何 含义 、 代 表 什 么 一 这 叫 
做 数据 ; 随后 ， 如 果 有 人 告诉 你 ， 这 是 三 个 孩子 的 年 龄 ， 
你 就 拥有 了 信息 ， 因 为 这 些 数 字 现 在 有 意义 了 。 
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动 动 





忆 \ 声 动笔 
观察 这 两 张 图 ， 你 觉得 主要 区 别 在 哪里 ? 为 什么 这 两 张 图 会 让 人 对 数据 


NA 
解 管 形成 如 此 不 同 的 第 一 印象 ? 
公司 每 月 利润 
构成 两 张 图 的 数据 基础 相同 ， 却 传递 出 不 同 的 信息 . i 
第 一 张 图 表明 ， 利 油 相 对 稳定 . 之 所 以 这 样 ， 是 因为 


这 张 图 揭 纵 轴 以 0 为 原点 ， 据 此 绘制 和 急 个 月 的 利 润 ， 









y 
( 各 羔 癌 囊 ) 海江 


季 \ 






一 





7 月 8 月 9 月 10 月 


月 份 
公司 每 月 利润 





11 月 










第 二 张 图 给 人 不 同 的 印象 ， 因 为 它 鬼 纵 轴 起 点 发 生 
了 变化 ， 标 度 也 相应 发 生 了 变化 。 乍 一 看 ， 每 个 月 
的 利润 显得 上 涨 显 着。 只有 细 细 查看 ， 你 才 会 明 饭 
到 底 是 怎么 回 事 。 


( 汕 亲 可 四 ) 竹 剖 以 

















8 月 9 月 10 月 


月 份 


11 月 









我 为 什么 要 操心 怎么 画图 啊 ? 
制图 软件 可 以 帮 我 们 搞定 一 切 ， 
它 就 派 这 用 场 . 





软件 无 法 蔡 你 思考 
制图 软件 可 以 为 你 节省 大 量 时 间 ， 生 成 有 效 的 图 表 ， 但 你 仍 需 了 
解 事情 的 来 龙 去 肪 

归根 结 底 ， 这 是 你 的 数据 。 能 否 为 自己 的 工作 选择 合适 的 图 表 、 
确保 数据 以 最 有 效 的 方式 展现 出 来 并 传达 你 想 传 达 的 信息 ， 这 取 
决 于 你 。 

软件 能 够 将 数据 转换 成 图 表 ， 至 于 图 表 是 否 正确 ， 这 得 由 你 来 保证 

6 深入 浅 出 统计 学 


芒 芒 游戏 公司 需要 绘制 图 表 


芒 芒 公司 是 一 家 富有 创意 的 游戏 软件 公司 ， 如 今 在 全 球 市 场 
风头 正 劲 。 公 司 首席 执行 官 受 邀 在 下 届 全 球 游戏 博览 会 上 发 


表 主 题 演讲 ， 他 需要 用 一 些 巧 妙 、 直 接 的 方法 展示 数据 ， 于 


是 找到 了 你 ， 让 你 给 他 摘出 这 些 东西 。 此 事 关系 重大 ， 若 主 
题 演讲 发 表 顺 利 ， 芒 芒 将 会 得 到 额外 赞助 ， 而 你 呢 ， 肯 定 会 

因为 工作 努力 到 手 大 笔 奖 金 。 

首席 执行 官 希望 能 够 办 到 的 第 一 件 事 是 对 各 种 游戏 的 满意 玩 

家 百分数 进行 比较 。 他 已 经 动手 用 一 些 绘图 软件 处 理 过 手头 

的 数据 ， 结 果 如 下 : 


其 他 


射击 ”1,500 
3,500 


动作 
6,000 


策略 
11,500 


各 种 游戏 销量 


Ca 


0 动 泪 脑 







相对 受 欢迎 程度 如 何 ? 


好 好 看 看 首席 执行 官 生成 的 饼 图 。 每 一 个 小 块 代表 什么 ? 猜 猜 看 ， 各 种 视频 游戏 的 
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饼 图 分 析 


呆板 的 饼 央 


“ 饼 图 ”的 作用 是 将 数据 划分 为 互 有 明显 区 别 的 几 个 组 ， 或 者 叫做 几 
个 类 。 饼 图 为 圆 形 ， 被 分 割 为 几 个 扇形 块 ， 每 一 块 代表 一 个 组 (类 ) 。 
扇形 块 的 大 小 表示 这 类 数据 占 总 体 的 比例 。 扇 形 块 越 大 ， 该 组 (类 ) 
的 相对 频繁 程度 越 大 。 一 个 特定 组 中 的 对 象 数目 称 为 频数 。 


饼 图 将 整个 数据 集 划 分 为 几 个 互 不 相干 的 组 。 这 意味 着 ， 如 果 把 每 个 
扇形 块 的 频数 加 起 来 ， 结 果 应 为 100% 


让 我 们 好 好 看 看 体现 了 各 种 游戏 软件 销量 的 饼 图 : 


其 他 这 一 块 扁 消 块 比 其 他 扁 形 块 小 得 多 ， 
射击 “1500 即 ， 这 一 美 六 戏 的 销量 低 得 乡 . 
3,500 ee 





he 


以 为 鳞 个 扁 形 块 
频数 就 百分数 ， 


各 种 游戏 销量 





那么 ， 饼 图 什么 时 候 有 辕 ? 


前 面 讲 过 ， 每 个 扇形 块 的 大 小 代表 你 所 展示 的 每 组 数据 的 相对 频 
数 。 因 此 ， 在 想 对 基本 比例 进行 比较 的 时 候 ， 饼 图 有 用 。 通 过 与 
其 他 组 进行 比较 ， 通 常 很 容易 一 眼看 出 哪个 组 具有 较 高 频数 。 当 
所 有 扇形 块 的 大 小 相似 时 ， 饼 图 用 处 不 大 ， 因 为 这 时 难以 根据 扇形 
块 尺寸 上 的 微小 差别 进行 判别 


那么 ， 芒 芒 首 席 执行 官 创 建 的 饼 图 有 用 吗 ? 


8 。 深入 浅 出 统计 学 


六 得 多 ， 即 ， 这 一 类 的 频数 最 高 













重要 统计 量 
频数 
“频数 ”表示 在 一 个 将 定 
组 ， 或 者 说 在 一 个 特定 区 


辣 内 的 统计 对 象 的 数目 ， 
类 似 于 数 数 。 







同形 过失 


看 到 创建 一 张 饼 图 能 如 此 出 色 地 体现 每 种 游戏 的 销量 ， 于是， 首席 执行 官 
决定 再 创建 一 张 图 ， 用 以 展现 消费 者 对 芒 芒 游戏 的 满意 度 。 首 席 执行 官 需 
要 这 样 一 张 图 : 能 让 他 对 每 种 游戏 的 满意 玩家 百分数 进行 比较 。 他 再 次 用 
制图 软件 倒 腾 了 一 下 数据 ， 但 是 这 一 次 ， 他 感觉 并 不 好 


其 他 体育 










么 回 事 ? 所 有 的 扇形 块 大 
小 相近 ， 但 所 标示 的 百分数 却 各 











未 相同 ， 并 且 百 分 数 数值 都 远 远 高 于 策略 
扁 形 块 所 占 的 比例 .你 能 帮 我 处 理 一 下 95% 
这 斐 图 吗 ? 马上 做 行 系 ? 
动作 
85% 
O 
饼 图 的 作用 是 对 不 同 组 ( 或 者 类 ) 所 占 的 比例 进行 每 种 游戏 的 满意 玩家 (%) 
比较 ， 但 在 这 个 例子 中 ， 各 个 组 的 比例 相差 无 几 。 
很 难 一 眼看 出 哪 一 类 玩家 的 满意 度 最 高 
用 与 扇形 块 所 占 整体 比例 无 关 的 百分数 来 标识 饼 图 通 名 
f 常 也 会 让 人 犯 晕 ， 例 如 ，“ 体 育 ” 块 标示 着 99% ， 但 体现 
这 一 块 在 饼 图 中 所 占 的 比例 仅 为 20% 左 右 。 另 一 个 问 比 三 


芒 巷 首 帝 执 行 官 题 是 ， 我 们 不 知道 每 种 游戏 的 反馈 数目 是 否 相 等 ， 


可 
此 也 无 法 知道 用 这 种 方式 对 满意 度 进行 比较 是 否 公 正 


kd 
(又) 


看 一 看 数据 ， 















一 想 这 张 图 有 什么 问题 。 对 于 这 种 信息 ， 用 哪 种 图 来 表现 更 好 ? 
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两 类 图 形 


条 形 因 更 具 精 确 性 


体现 这 种 数据 的 更 好 办 法 是 使 用 条 形 图 。 就 像 饼 图 一 样 ， 条 形 图 能 让 
你 对 相对 大 小 进行 比较 ,但 条 形 图 还 有 这 样 一 个 优点 : 更 精确 。 对 于 
各 个 类 的 大 小 大 致 相同 的 情况 ， 条 形 图 是 理想 的 图 形 ， 你 能 更 精确 地 
指出 哪个 类 的 频数 最 高 ， 也 更 容易 发 现 细小 的 差别 。 


条 形 图 中 的 每 一 个 长 方形 代表 一 个 特定 类 ， 长 方形 的 长 度 代表 某 种 数 
值 。 长 方形 越 长 ， 数 值 越 大 。 所 有 长 方形 的 宽度 都 相等 ， 这 样 更 容易 
进行 比较 。 

条 形 图 可 以 是 垂直 的 ， 也 可 以 是 水 平 的 。 


重 直 条 形 周 


垂直 条 形 图 用 横 轴 表示 类 ， 用 纵 轴 表示 频数 或 百分数 。 每 个 长 
方形 的 高 度 代 表 相 应 类 的 数值 。 下 面 这 个 例子 体现 了 五 个 地 区 
(A、B、C、D、E) 的 销量 ( 件 ) 。 





过 是 全 8000 每 个 长 方形 代 
7000 胡 一 个 地 区 . 


6000 Vy 





A B C D E 
各 地 区 销量 ( 件 ) 
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第 一 印象 


水 乎 条 形 周 


水 平 条 形 图 和 垂直 条 形 图 一 样 ， 只 不 过 两 根 轴 对 调 了 一 下 。 水 平 条 形 
图 用 纵 轴 代 表 类 ， 用 横 轴 代表 频数 或 百分数 。 


下 面 是 用 第 9 页 上 首席 执行 官 的 各 类 游戏 满意 玩家 数据 生成 的 水 平 条 形 
图 。 如 你 所 见 ， 利 用 这 张 图 能 更 快 、 更 容易 地 衡量 哪 一 类 的 数值 最 高 ， 
哪 一 类 的 数值 最 低 。 要 条 长 方形 的 长 度 代表 对 该 


种 游戏 满意 
所 有 长 方 形 都 每 种 游戏 的 满意 玩家 (%) ”ai 的 玩家 的 百分数 ， 
为 水 平 长 方形 ， — - 












体育 
策略 ET 
系 条 长 务 形 -| /全 MO 
rt 





0 10 20 30 40 50 60 70 80 90 100 6 分 雪 几 柱 加 胃 熙 ， 
满意 率 ( % ) 


垂直 条 形 图 更 常用 。 不 过 .如 果 类 名 称 太 长 ,水平 条 形 图 就 有 用 了 一 
你 将 有 大 量 空白 位 置 标示 每 个 类 的 名 称 ， 不 用 横 七 竖 八 地 进行 摆布 。 


上 面 的 径直 条 有形 图 体现 了 频数 ， 水 平 条 形 
图 体现 了 百分数 .我 什么 时 候 该 用 频数 ? 
什么 时 候 访 用 百分数 ? 


这 要 看 你 想 传达 什么 消息 。 
让 我 们 好 好 看 看 。 





第 1 章 ”信息 图 形 化 11 


人 


标 度 的 影响 力 


懂得 利用 “ 标 度 ” 能 让 你 创建 强大 的 条 形 图 ,凸显 你 希望 别人 注意 的 主要 
事实 。 不 过 ,小心 哦 一 标 度 同样 能 隐匿 与 数据 有 关 的 重要 事实 。 下 面 让 
我 们 看 看 具体 情况 。 


使 用 百分数 标 度 


让 我 们 先 来 好 好 看 看 体现 每 种 游戏 的 玩家 满意 度 的 条 形 图 。 横 轴 表 示 玩 家 
满意 度 百分数 ， 即 每 100 个 人 中 有 多 少 人 对 这 款 游戏 感到 满意 。 
每 种 游戏 的 满意 玩家 (%) 





0 10 20 30 40 50 60 70 80 90100 
满意 率 ( %) 


这 张 图 的 目的 是 让 我 们 对 不 同 的 百分数 进行 比较 ,还 能 从 图 中 读 出 百分数 。 


只 是 有 一 个 问题 一 图 中 没有 告诉 我 们 每 种 游戏 有 多少 玩 家 。 这 听 起 来 好 
像 不 是 特别 重要 ， 但 意味 着 我 们 无 法 知道 这 张 图 反映 的 是 所 有 玩家 的 看 法 
呢 ， 还 是 部 分 玩家 的 看 法 ， 或 甚至 只 是 屈指 可 数 的 几 个 玩家 的 看 法 。 换 句 
话说 .我 们 无 法 知道 这 能 在 多 大 程度 上 代表 “玩家 ”这 个 整体 。 在 设计 以 
百分数 为 表现 内 容 的 图 形 时 ， 请 考虑 这 样 一 条 黄金 定律 : 设法 指出 频数 一 
或 是 将 频数 标 在 图 形 中 间 ， 或 是 标 在 图 形 旁 边 ， 均 可 。 


若 只 有 百分数 而 没有 频数 ， 或 只 有 频数 而 没有 吉 分 数 ， 那 可 千 万 要 小 心 。 


有 时候， 这 是 一 种 用 来 隐藏 基础 数据 真实 情况 的 伎俩 ， 因 为 仅 靠 一 张 图 无 法 判断 这 张 图 能 在 多 大 
程度 上 代表 整个 数据 。 你 可 能 会 发 现 ， 有 很 大 比例 的 人 青睐 某 种 特定 游戏 类 别 ， 但 受到 调查 的 仅 
有 10 人 ; 或 者 ， 你 可 能 会 发 现 ， 有 10,000 个 玩家 最 喜欢 玩 的 是 体育 游戏 ， 但 仪 通过 这 个 数据 无 法 
判断 这 个 人 数 在 所 有 游戏 玩家 中 占有 的 比例 是 高 还 是 低 。 





人 小心} 
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使 用 频数 标 度 


你 可 以 用 频数 标 度 代替 百分数 标 度 。 这 样 大 家 就 很 容易 看 出 确 
切 的 频数 ， 进 而 对 数值 进行 比较 。 


每 神游 戏 的 满意 玩家 人 数 
体 至 辆 国 区 








这 张 鸭 把 跌 了 感到 满意 


策略 Bi < 一 的 人 数 . 儿 并 百分数 ， 


动作 荆 
射击 本 和 
其 他 因 


0 5000 10000 15000 20000 25000 30000 


满意 人 数 


通常 ， 标 度 以 0 为 起 点 。 但 要 小 心 ! 并 非 每 张 图 都 是 这 么 做 的 ， 正 如 第 
6 页 看 到 的 ， 使 用 不 以 0 为 起 点 的 标 度 可 以 让 数据 给 人 不 同 的 第 一 印象 ， 
查看 别人 绘制 的 图 时 ， 要 小 心 这 一 点 ， 这 很 容易 让 你 无 视 某 些 数据 ， 
从 而 对 数据 形成 错误 的 印象 。 


你 是 说 我 必须 二 选 一 一 
用 频数 或 是 用 百分数 ? 
风采 我 都 起 用 呢 ? 


有 一 些 绘图 方法 能 够 绘制 出 表现 形式 更 婴 活 的 条 形 图 。 


以 上 这 些 条 形 图 的 问题 是 ， 它 们 或 是 显示 满意 玩家 的 人 数 ， 或 是 
显示 满意 玩家 的 百分数 一 但 仅仅 显示 了 “满意 玩家 ”的 倩 况 。 


让 我 们 看 看 如 何 解 决 这 个 问题 。 
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一 张 图 形 ， 两 批 数 据 


处 理 多 批 数据 


实际 上 ， 通 过 条 形 图 能 够 轻而易举 地 在 同一 张 图 形 上 展现 多 批 数 据 。 举 个 
例子 : 我 们 可 以 将 满意 玩家 的 频数 和 不 满意 玩家 的 频数 都 画 在 同一 张 图 上 。 


堆积 条 形 周 


解决 这 个 问题 的 一 个 办 法 是 : 针对 每 种 游戏 ， 
用 一 条 长 方形 代表 这 类 游戏 的 满意 玩家 频数 ， 


用 男 一 条 长 方形 代表 这 类 游戏 的 不 满意 玩家 


频数 。 当 你 想 比较 频数 时 ， 这 种 图 很 有 用 ， 


但 通过 这 张 图 难以 看 出 比例 和 百分数 。 


分 段 条 形 峡 


若 要 同时 体现 频数 和 百分数 ， 可 以 试 试 “ 分 
段 条 形 图 ”。 这 种 图 用 一 整 段 长 方形 代表 一 
个 类 ,但 可 以 按 比例 把 这 一 整 段 长 方形 分 割 
成 几 小 段 。 长 方形 的 整体 长 度 反 映 出 整体 
频数 。 

通过 这 种 图 可 以 迅速 看 出 每 个 类 的 总 频 
数 一 在 我 们 的 例子 中 即 每 种 游戏 的 玩家 
总 数 ; 可 以 看 出 满意 玩家 的 频数 ; 还 可 以 
一 眼看 出 比例 。 
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0 





5000 10000 15000 20000 25000 30000 


5000 10000 15000 20000 25000 30000 


轩 满意 
转 不 满意 


园 满意 
国 不 满意 


第 一 印象 


首席 执行 官 需要 为 主题 演讲 绘制 另 一 张 图 。 下 面 是 数据 ， 看 你 能 不 能 画 一 张 条 形 图 。 


ET 


这 是 软件 生成 的 另 一 张 图 。 显 示 2007 年 哪 种 游戏 卖 得 最 好 ? 这 
种 游戏 在 2006 年 销量 如 何 ?” 


各 种 游戏 销量 
园 2 
园 2007 


5000 10000 15000 20000 25000 30000 


销量 ( 件 ) 
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首席 执行 官 需要 为 主题 演讲 绘制 另 一 张 图 。 下 面 是 数据 ， 看 看 你 能 不 能 创建 这 张 图 形 。 
各 洲 销 量 


国 儿 主 (人 ) 


北美 洲 ， 
南美 洲 500 欧洲 
1,500 


亚洲 
大 洋 洲 
慕 洲 
南极 洲 


0 200 400 600 800 1000 1200 1400 1600 1800 2000 


销量 


这 是 软件 生成 的 另 一 张 图 。 显 示 2007 年 哪 种 游戏 卖 得 最 好 ? 这 
种 游戏 在 2006 年 销量 如 何 ? 
各 种 游戏 销量 


2007 年 体育 游戏 销量 最 将 ， 售 出 27,500 件 . 
这 种 弦 戏 在 2006 年 只 售 出 14,000 件 ， 开 和 未 
多 .策略 游戏 在 2006 年 网 销 量 高 于 其 他 洲 
戏 种 类 . 


5000 10000 15000 20000 25000 30000 


销量 ( 件 ) 
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第 一 印象 


你 的 条 形 图 闪 亮 登场 
首席 执行 官 对 你 画 出 的 条 形 图 赞赏 不 
已 一 但 他 还 需要 在 主题 演讲 中 报告 
更 多 数据 















千 得 好 ! 这 些 图 会 在 博览 会 上 闪闪 发 光 。 纲 在 再 
给 你 一 个 任务， 我们 请 一 群 志愿 者 对 新 游戏 进行 
了 测试 ， 需 要 用 一 张 图 来 展 观 每 局 游戏 的 得 分 情 
况 。 数据 出 下 : 
游戏 得 分 在 0 一 999 之 间 
得 分数 据 和 容 分 成 几 个 Ay | 
例 屿 ， 得 分 在 0 一 100 % 
范围 内 的 决 数 为 5 





频数 为 得 分 在 基 个 
~ [SL 全 范围 中 出 现 的 次 数 。 








这 些 数据 看 上 南 系 同 于 我 们 之 前 看 到 过 
的 其 他 类 型 的 数据 . 这 是 未 是 说 我 们 要 用 未 
同 的 办 法 进行 处 理 ? 


请 回头 浏览 本 章 内容 。 你 觉得 这 些 数据 和 前 面 的 比 有 什 
么 不 同 吗 ? 你 觉得 这 种 不 同 会 对 图 形 产生 什么 影响 ? 





类 别 数据 与 数值 型 数据 


类 别 与 数字 


使 用 图 形 时 ， 其 中 一 个 重要 事项 是 弄 清楚 所 处 理 的 是 哪 一 类 数据 。 只 要 搞 清楚 这 一 点 ， 
你 就 会 更 容易 决定 哪 一 种 图 表 能 够 最 好 地 体现 你 的 数据 。 


类 别 数据 (定性 数据 ) 


目前 我 们 讲 过 的 大 部 分 数据 都 是 类 别 数据 。 数 据 被 划 
分 为 各 种 类 别 ， 用 以 描述 某 类 的 性 质 或 特征 。 因 此 ， 
类 别 数据 也 称 为 定性 数据 。 游 戏 种 类 就 是 定性 数据 的 一 
个 实例 一 每 个 游戏 种 类 形成 一 个 独立 的 类 别 。 


关于 定性 数据 ， 请 记 住 一 个 重点 : 不 能 将 数据 值 理解 
为 数字 。 


数值 型 数据 (定量 数据 ) 


数值 型 数据 不 同 ， 它 所 涉及 的 是 数字 。 数 值 型 数据 中 的 
数值 具有 数字 的 意义 ， 但 还 涉及 计量 或 计数 。 由 于 数值 
型 数据 描述 的 是 数量 ， 所 以 也 称 为 定量 数据 。 





ppaaupuapnpamnpnmymmnpmpppom 上 


Ses. Bs 6 7 ‘0 1 


HFAULES z 






长 度 


这 对 芒 芒 的 图 形 有 什么 影响 呢 ? 
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处 理 分 组 数据 


芒 芒 首席 执行 官 给 我 们 的 最 新 数据 是 数值 型 数据 ， 另 外 ， 这 些 得 enn 
分 被 分 为 几 个 组 ， 放 人 不 同 的 区 间 。 那 么 ， 最 好 用 哪 种 办 法 为 这 信人 一 7 
类 数据 绘制 图 形 ? 效 入 不 同 区 同 









200-399 |29 | 
400-599 |55 
e007799 [17 
ls00-999 |3 | 












这 还 未 容易 ， 示 就 是 用 先 
前 用 过 的 那 种 条 形 圈 吗 ? 
我 们 可 以 把 每 个 组 当 作 一 个 
独立 的 类 别 。 





可 是 可 以 ， 但 还 有 更 好 的 办 法 。 

我 们 可 以 不 把 每 一 个 得 分 范围 作为 一 个 独立 的 类 别 ， 而 是 利用 手 
头 数据 是 数值 型 这 一 特点 ， 用 连续 的 数字 标 度 体现 数据 。 也 就 是 
说 ， 我 们 不 是 用 长 方形 表示 一 个 项 ， 而 是 用 长 方形 表示 一 个 得 分 
范围 。 


为 此 ， 我 们 可 以 创建 直方 图 。 


直方 图 与 条 形 图 外 观 相 似 ， 但 有 两 个 重大 区 别 。 第 一 ， 每 个 长 方 
形 的 面积 与 频数 成 比例 ; 第 二 ， 图 上 的 长 方形 之 间 没 有 间隔 。 下 
面 是 一 个 直方 图 实例 ， 显 示 了 统计 邦 中 的 每 户 人 家 每 月 购买 游戏 










的 平均 数目 。 
每 月 购买 游戏 数目 
3 
频 
大 水 烽 数 . | 一 不 方形 之 则 语 有 同和 ， 
此 数值 通 这 这 续 的 
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建立 直方 图 


绘制 直方 图 起 步 : 求 出 长 方形 宽度 


创建 直方 图 第 一 步 : 查看 每 个 区 间 ， 求 出 每 个 区 间 的 宽度 ， 以 及 每 得 分 | 频数 | 
个 区 间 涵 盖 的 数据 范围 。 同 时 ， 要 确保 直方 图 的 各 个 长 方形 之 间 没 有 lo-199 |5 | 
间隔 。 200-3%99 |29 | 

1400-599 56 | 
让 我 们 从 前 两 个 区 间 开 始 : 0 一 199 和 200 一 399。 从 表面 数值 上 看 ， 第 一 


个 区 间 的 终点 是 199 分 ， 第 二 个 区 间 的 起 点 是 200 分 。 不 过 ， 要 是 这 样 ls00-999 |3 | 
画图 的 话 ， 问 题 就 来 了 : 199 和 200 之 间 将 出 现 间 隔 ， 如 下 所 示 : 


199 200 


直方 图 的 长 方形 之 间 不 该 有 间隔 。 因 此 ， 为 了 解决 上 述 问题 ， 我 们 把 
以 上 范围 稍微 扩大 一 点 儿 。 我 们 不 要 让 第 一 个 区 间 在 199 结 束 ， 也 不 
要 让 下 一 个 区 间 从 200 开 始 ， 而 是 让 两 个 区 间 在 199.5 会 合 ， 如 下 所 示 : 








199.5 


这 样 就 形成 了 一 条 唯一 边界 ， 确 保 直 方 图 的 长 方形 之 间 没 有 间隔 。 依 法 
炮制 其 余 区 间 ， 可 得 到 下 列 边界 : 


5 


“0. 199.5 399.5 599.5 799.5 999.5 


每 个 区 间 涵 盖 200 个 得 分 ; 每 个 区 间 的 宽度 为 200; 每 个 区 间 宽 度 相 同 。 


由 于 所 有 区 间 宽 度 相 同 ， 我 们 这 样 创 建 直方 图 : 为 每 一 个 得 分 范围 绘制 
垂直 长 方形 ， 使 用 边界 作为 每 个 长 方形 的 起 点 和 终点 。 每 个 长 方形 的 高 
度 等 于 频数 。 
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第 一 印象 


下 面 是 芒 芒 公司 的 数据 备 忘 表 。 





绒 习 





看 看 你 是 否 能 利用 这 些 边界 为 以 上 数据 创建 一 张 直方 图 。 记 住 ， 频 数位 于 纵 轴 上 。 


40 


30 


20 
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练习 解答 


下 面 是 芒 芒 公司 的 数据 备 忘 表 。 









200-399 


400-599 


ls00-999 |3 


看 看 你 是 否 能 利用 这 些 边 界 为 以 上 数据 创建 一 张 直 方 图 。 记 住 ， 频 数位 于 纵 轴 上 。 







用 频数 未 示 每 个 长 
60 
方形 蛤 高 度 . 
各 种 游戏 得 分 
50 
频 40 
数 出 长 方 箭 沉 
利多 每 个 区 网 的 边界 二， 六 级 长 
30 5 到 T7995 之 
度 ， 从 599.5 237 09 这 个 狂 分 范围 ， 


方形 代表 600 一 了 
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第 一 印象 


世上 没有 偿 问 题 


问 :这 么 说 ， 直方 图 基本 上 是 用 来 体现 分 组 数值 
型 数据 的 ? 


答 ;， 是 的 。 它 的 优点 是 : 由 于 是 数值 型 图 形 ， 所 
以 可 以 体现 每 个 区 间 的 宽度 ,还 可 以 体现 频数 。 


阅 : ”如 果 各 个 区 间 的 宽度 不 同 会 怎么 样 ? 还 能 使 
用 直方 图 吗 ? 


签 : 完全 可 以 。 区 间 宽度 相同 是 较为 常见 的 情 
况 ， 但 直方 图 上 的 区 间 并 不 是 非 相 等 不 可 。 对 于 区 
间 不 等 的 直方 图 ， 创 建 步 琴 和 要 多 两 个 我 们 很 快 
会 介绍 创建 方法 。 


问 : 


签 ; 至 少 有 两 个 有 力 的 理由 。 第 一 是 为 了 体现 出 
数值 之 间 没 有 间 了 中， 每 个 数值 都 包含 在 内 ; 第 二 是 
让 区 间 宽 度 反映 出 所 涵盖 的 数 慎 的 范围 。 例 如 ， 要 
是 我 们 从 0 到 199 务 出 0 一 199 这 个 区 闻 ， 图 上 的 宽度 
就 是 199-0=199。 


和 


频数 是 一 种 统计 方法 ， 用 于 描述 一 个 类 别 中 有 和 多少 
小 
人 项。 


饼 图 能 很 好 地 体现 基本 比例 。 
条 形 图 更 灵活 、 更 精确 。 
数值 型 数据 涉及 的 是 数字 和 数量 ; 类别 数据 涉及 的 


直方 图 的 长 方形 之 间 为 什么 不 能 有 间 辽 ? 


是 表述 和 质量 。 


水 平 条 形 图 用 于 展现 类 别 数据 ， 尤 其 是 在 类 别名 称 
太 长 的 时 候 。 


问 : ”我 们 为 什么 要 让 长 方形 在 两 个 数值 的 中 间 会 
合 呢 ? 
从 : 长 方形 必须 会 合 ， 而 且 通 常 在 中 间 位 置 会 


会 ， 但 最 终 取 决 于 所 采用 的 舍 入 方法 。 在 取 整 时 ， 
你 通常 会 取 离 数值 最 近 的 整数 ， 这 就 是 说 ， 从 -0.5 
到 0.5 这 个 范围 内 的 所 有 数值 都 会 取 整 为 0， 于 是 ， 当 
我 们 在 直方 图 上 表示 0 时 ， 我 们 就 用 从 -0.5 到 0.5 这 个 
范围 来 表示 0 这 个 数 。 


问 ， 有 例外 吗 ? 


每 ， 有 ,年龄 就 是 个 例外 。 如 果 你 要 在 直方 图 上 
表示 18 一 19 这 个 年 龌 范 围 ， 通 常会 用 18 -20 这 个 区 
间 来 表示 。 原 因 是 ， 以 19 岁 为 例 ， 在 某 人 过 20 岁 生 


日 之 前 ， 我 们 通常 会 把 他 归 入 19 岁 。 所 以 ， 我 们 用 了 
向 下 取 整 。 


垂直 条 形 图 用 于 展现 数值 型 数据 ; 若 类 别名 称 不 
长 ， 也 用 于 体现 类 别 数据 。 


可 以 在 一 张 条 形 图 上 体现 多 批 数据 ， 有 具体 做 法 可 由 
你 选择 。 可 以 使 用 堆积 条 形 图 ， 让 相互 关联 的 长 
方形 并 列 显示 ， 借 此 比较 频数 ; 可 以 使 用 分 段 条 形 
图 ， 把 长 方形 一 个 一 个 衔接 起 来 ， 借 此 显示 比例 和 
总 频数 。 


条 形 国标 度 可 以 是 百分数 ， 也 可 以 是 频数 。 
每 张 图 都 变化 多 端 
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芒 蕊 游戏 公司 需要 另 画 一 由 


i 
外 创建 一 张 直方 图 。 这 一 次 ， 他 想 让 直方 图 显示 芒 芒 玩家 在 24 小 时 内 
ee 下 面 是 数据 : 


小 时 | [I 
er 
Er 













这 些 数据 有 些 意思 。. 数 
据 的 分 组 方法 像 上 次 一 
样 ， 但 区 间 宽 度 并 未 都 
相同 


他 说 对 了 ， 区 间 宽 度 并 不 都 相同 。 

只 要 看 看 这 些 区 间 ， 就 能 看 出 它们 具有 不 同 的 宽度 。 例 如 ，10 一 24 这 
个 范围 涵盖 的 小 时 数 远 多 于 0 一 1 这 个 范围 。 

如 果 我 们 有 办 法 得 到 原始 数据 ， 就 可 以 看 看 如 何 设 法 构建 等 宽 区 间 ， 
但 遗憾 的 是 ,我们 所 拥有 的 全 部 数据 都 在 这 儿 了 。 我 们 需要 找到 这 样 
一 种 绘制 直方 图 的 方法 容许 数据 区 间 具 有 不 同 宽度 。 


直方 图 的 特点 是 : 频数 与 每 个 长 方形 的 面积 成 比例 。 你 
会 如 何 利用 这 一 点 为 以 上 数据 创建 直方 图 ?你 需要 知道 


些 什 么 ? 





24 深入浅出 统计 学 














我 想 我 们 可 以 用 以 前 用 过 的 方法 创建 这 张 图 ， 
没什么 大 未 了 的 .利用 数字 标 度 画 出 长 方形 ， 
只 不 过 这 次 的 长 方形 宽度 不 一 样 。 










你 认为 她 对 吗 ? 
下 面 是 一 张 草图 ,垂直 标 度 为 频数 ， 长 方形 宽度 与 区 间 大 小 成 
比例 绘制 。 你 看 出 问题 了 吗 ? 


每 天 游戏 时 间 


Mi te 


信和 


小 时 


直方 图 的 长 方形 面积 必须 与 频数 成 比例 

这 张 图 的 问题 是 ， 为 了 让 每 个 长 方形 的 宽度 反映 出 每 个 区 间 的 宽度 ， 
结果 造成 一 些 长 方形 看 起 来 超大 ， 比 例 失衡 。 乍 一 看 ， 你 可 能 对 人 
们 每 天 玩 游戏 的 实际 时 间 心 生 误会 。 例 如 ， 面 积 最 大 的 长 方形 是 显 
示 玩 游戏 时 间 在 10-24 小 时 之 间 的 长 方形 ， 但 大 部 分 人 并 不 玩 这 和 
长 时 间 

由 于 这 是 一 张 直 方 图 ， 我 们 需要 让 长 方形 面积 与 长 方形 所 代表 的 频 
数 成 比例 。 长 方形 的 宽度 不 相同 ， 我 们 该 怎么 处 理 长 方形 的 高 度 呢 ? 
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调整 长 方形 面积 


让 直方 固 长 方形 的 面积 与 频数 成 比例 


到 目前 为 止 ， 我 们 已 经 能 用 长 方形 的 高 度 表示 特定 数字 或 类 别 的 
频数 了 。 


这 一 次 ,我 们 要 处 理 分 组 数值 型 数据 这些 数据 的 区 间 宽 度 各 不 
相等 。 我 们 当然 可 以 让 每 个 长 方形 的 宽度 反映 每 个 区 间 的 宽度 ， 
可 是 这 种 做 法 的 问题 是 : 长 方形 具有 不 同 宽度 ， 这 会 影响 每 条 长 
方形 的 总 面积 。 


我 们 需要 确保 等 条 长 方形 的 面积 与 频数 成 比例 。 这 意味 着 ， 只 要 
我 们 调整 长 方形 宽度 ， 就 要 同时 调整 长 方形 高 度 。 如 此 一 来 ， 就 
能 在 改变 长 方形 宽度 -一 最 终 使 其 反映 分 组 宽度 的 同时 ， 保 持 长 
方形 的 面积 与 频数 相 吻 合 。 


让 我 们 看 看 如 何 创建 一 张 新 直 方 图 。 


第 1 步 : 求 长 方形 宽度 


看 看 长 方形 所 团 闵 的 数值 范围 ， 就 能 知道 长 方形 应 该 有 多 宽 。 换 名 
话说 ， 我 们 需要 求 出 每 个 组 中 包含 多 少 个 “ 整 小 时 ”。 


让 我 们 取出 “1-3” 这 个 组 。 这 个 组 包含 2 个 整 小 时 :1-2 和 2-3。 
这 表示 长 方形 的 宽度 必须 为 2， 边 界 为 1 和 3。 


这 征 “1-3 组 ， 组 中 含有 2 个 玖 小 时 . 所 以 置 度 为 2. 





100 200 300 
算 一 算 其 余 宽度 ， 得 出 : 





10-24 
算出 长 方形 宽度 后 ， 就 可 以 接着 求 高 度 了 。 
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直方 图 的 特点 是 : 
长 方形 面积 表示 频数 。 


第 一 独 象 


第 2 步 ， 求 长 方形 高 度 


求 出 所 有 组 的 宽度 后 ， 就 可 以 利用 这 些 宽度 求 出 长 方形 应 该 有 的 高 度 。 

别 忘 了 ， 我 们 需要 调整 长 方形 高 度 ， 使 得 每 个 长 方形 的 整体 面积 与 相 

应 组 的 频数 成 比例 。 

首先 ， 让 我 们 定 下 每 个 长 方形 的 面积 。 前 面 说 过 ， 频 数 等 于 面积 。 由 于 

我 们 已 知 每 个 组 的 频数 、 也 就 知道 面积 应 该 是 多 少 : 过 出 频 数 元 位 一 开 巾 就 知道 ，” 
长 方形 加 积 = 每 组 频数 。 大 一 二 我 们 知道 日 析 而 可是” 


现在 每 个 长 方形 基本 上 就 是 一 个 矩形 ， 这 意味 着 每 个 长 方形 的 面积 等 
于 宽度 乘 以 高 度 。 由 于 面积 等 于 频数 、 即 : 


频数 = 长 方形 宽度 x 长 方形 高 度 


面积 = 频数 
我 们 在 上 一 步 求 出 了 长 方形 的 宽度 ， 于 是 ， 可 以 用 这 些 宽度 求 出 每 [一 人 
个 长 方形 的 高 度 。 即 ; sx | Ve 
频数 < 一 一 一 一 > 
长 方形 高 度 = 一 一 一 一 吕 克 


长 方形 宽度 


长 方形 高 度 用 于 量度 一 个 特定 组 的 频数 的 集中 程度 ， 是 对 频数 密集 
度 的 一 种 量度 ， 是 用 于 说 明 数 字 到 底 是 “ 称 密 ”还 是 “稀薄 ”的 一 
种 方法 。 长 方形 的 高 度 称 为 频数 密度 。 


必 当 动 划 


3 lm | | 
ss lo | 
sl ls | | 
om lo il | 







每 个 长 方形 的 高 度 应 该 是 多 少 ? 填写 下 列表 格 。 
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每 个 长 方形 的 高 度 应 该 是 多 少 ? 填写 下 列表 格 。 


高 度 ( 频数 密度 ) 
4,300 二 1=4,300 
6,900 二 2=3,450 


4.900 二 2 一 2.450 
2.000 二 5 一 400 
2.100 二 14 一 150 





第 9 步 : 画 出 直方 周 


求 出 每 个 长 方形 的 宽度 和 高 度 之 后 ， 就 能 画 出 直方 图 了 。 画 图 方 
法 和 以 前 一 样 ， 但 这 次 ， 我 们 为 纵 轴 标 上 频数 密度 ， 而 非 频数 
下 面 是 经 过 修订 的 直方 图 。 


每 天 游戏 时 间 


吉 表示 1000 天 








i 下 图 例 可 用 可 未 用 况 在 ， 长 方 于 天 口 


Ce / 间 没 有 间 涡 ， ee 面 航 与 数据 就 比例 ， 


oi1 7 3 5 10 信 24 
尽管 长 方 稍 1-3 拘 频数 要 高 ， 但 i Ee 小 时 


实际 上 ， 它 的 频数 密度 却 低 二 “在 才 这 名 
际 上 ， 六 

， < 他 林 度 4 从 
0-1 这 个 长 方形 鬼 频数 密度 。 “人 经 市 。 
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频数 密度 指 的 是 数据 中 的 数值 密集 度 。 频 数 密度 与 频 
数 有 关 ， 但 并 非 同 一 事物 。 下 面 用 一 个 比喻 来 说 明 二 
者 之 间 的 关系 
想像 一 下 ， 你 有 一 些 果 汁 ， 并 将 这 些 果 汁 倒 进 玻璃 
杯 ， 如 图 所 示 : 


这 是 柴 在 玻 端 标 中 次 全 部 
果汁 它 欧 浪 位 在 这 里 . 


要 是 把 相同 分 量 的 果汁 倒 和 信 另 一 个 不 同 尺寸 玻璃 杯 ( 假 
定 “ 宽 ”一 点 儿 ) ,情况 如 何 呢 ? 果 汁液 位 有 何 变化 ? 一 一 
图 中 的 玻璃 杯 宽 一 点 儿 ， 因 此 果汁 液 位 降低 了 

果汁 液 位 随 着 玻璃 杯 的 宽度 发 生变 化 ， 玻 璃 杯 越 宽 ， 液 
位 越 低 ; 反之 亦 然 一 玻璃 杯 越 罕 ， 果 计 液 位 越 高 


那么 ， 果 汁 与 频数 密度 有 什么 关系 ? 


果汁 = 频数 

这 样 想像 : 你 不 是 在 向 玻璃 杯 中 倒 果汁 ， 而 是 在 把 频数 “ 倒 人 ”图 
形 中 的 长 方形 。 正 如 你 知道 玻璃 杯 的 宽度 一 样 ， 你 也 知道 长 方形 的 宽 
度 ; 正如 果汁 在 玻璃 杯 中 占有 的 空间 ( 底面 积 x 高 ) 等 于 玻璃 杯 中 的 
果汁 的 分 量 ， 图 中 的 长 方形 的 面积 等 于 其 频数 。 


这 样 一 来 ， 频 数 密度 就 等 于 长 方形 的 高 度 ， 接 着 使 用 上 面 的 比喻 ， 这 
个 高 度 就 等 于 果汁 在 每 个 玻璃 杯 中 的 液 位 。 较 宽 的 玻璃 杯 意味 着 果汁 
会 达到 一 个 较 低 的 液 位 ， 而 较 宽 的 长 方形 意味 着 频数 密度 会 较 低 。 
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艺 点 及 世上 上 没有 个 向 是 


全 


30 


m 频数 密度 指 的 是 分 组 数据 中 的 频数 的 密集 度 。 计 算 
方法 如 下 : 
频数 密度 - 
组 距 


”直方 图 是 一 种 专门 用 于 体现 分 组 数据 的 图 形 。 它 看 
起 来 很 像 条 形 图 ， 但 每 条 长 方形 的 高 度 等 于 频数 密 












度 一 而 不 是 频数 。 


”绘制 直方 图 时 ， 每 个 长 方形 的 宽度 与 其 分 组 宽度 
(“组 距 ”) 成 正比 例 。 长 方形 按照 连续 的 数字 标 
度 绘 制 。 


昌 ”直方 图 中 的 每 个 组 的 频数 通过 长 方形 面积 求 出 。 
@。 直方 图 的 长 方形 之 间 没 有 间隔 。 


世上 没有 俐 问题 


阅 :。 画 直方 图 时 ， 为 什么 用 面积 代表 频数 ? 


签 :这样 做 可 以 保证 每 个 组 的 相对 大 小 与 数据 
成 正比 例 ， 且 不 失真 实 。 处 理 分 组 数据 时 ， 我 们 雪 
要 通过 一 种 直观 的 方法 体现 每 个 组 的 宽度 及 频数 。 
改变 长 方形 宽度 是 一 种 反映 分 组 范围 的 直觉 方法 ， 
但 这 种 方法 有 一 个 副作用 一 会 使 一 些 长 方形 看 起 
来 比例 失衡 。 

调整 长 方形 高 度 并 用 面积 表示 频数 ， 这 是 解决 以 上 
问题 的 一 个 办 法 。 有 了 这 个 办 法 ， 大 家 就 不 会 由 于 
类 个 组 占用 了 太 多 或 太 少 空间 而 产生 错觉 。 


问 : 什么 又 是 频数 密度 呢 ? 


签 ;频数 密度 是 表示 某 个 特定 区 间 中 的 数据 密 
集 度 的 一 种 方法 。 通 过 这 种 方法 可 以 对 宽度 可 能 有 
差别 的 几 个 区 间 进 行 比较 。 在 这 种 方法 中 ， 频 数 与 
长 方形 的 面积 成 正比 例 ， 而 不 是 与 高 度 成 正比 例 。 

为 了 求 出 频数 密度 ， 应 取出 这 个 区 闻 的 频数 ， 用 它 
除 以 宽度 。 
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| 奖 : ”如 果 我 已 经 将 数据 分 组 ， 但 所 有 的 区 间 都 具 
有 相同 宽度 ， 我 能 使 用 普通 的 条 形 图 吗 ? 


签 :; 使 用 直方 图 能 更 好 地 体现 体 的 数据 ， 因 为 
你 还 要 接着 对 分 组 数据 进行 处 理 。 你 确实 需要 让 频 
数 与 面积 成 比例 ， 而 不 是 与 高 度 成 正比 例 。 


阅 : 直方 图 “必须 ”体现 分 组 数据 吗 ? 能 不 能 用 
于 体现 一 个 个 数字 及 一 批 批 数字 ? 


答 : 能 。 主 要 记 住 这 一 点 : 确保 长 方形 之 间 没 有 
间隔 ， 以 及 每 个 长 方形 的 宽度 均 为 1。 为 了 实现 这 一 
点 ， 通 常 可 将 教 据 中 的 数字 放 在 长 方形 的 中 央 。 

例如 ， 如 果 要 画 一 个 长 方形 代表 单独 的 数字 1， 则 必 


须 画 一 个 范围 为 0.5 到 1.5 的 长 方形 ，1 位 于 这 个 范围 
的 中 央 。 


第 一 印象 





下 面 这 张 直方 图 体现 了 每 打 一 局 “疯狂 奶牛 ”游戏 达到 的 级 数 。 总 共 打 了 几 局 游戏 ? 假定 每 
一 级 为 一 个 整数 。 





练习 


每 局 游戏 达到 的 级 数 





-1 Ao 1 2 3 4 
-0.5 至 0.5 代 表 0 级 因为 这 个 ey 
范围 内 的 所 有 数值 场 取 整 为 0. 
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练习 解答 


下 面 这 张 直 方 图 体现 了 每 打 一 局 “疯狂 奶牛 ”游戏 达到 的 级 数 。 总 共 打 了 几 局 游戏 ? 假定 每 






错 习 一 级 为 一 个 整数 。 
其 者 每 局 游戏 达到 的 级 数 
50 - 
| 代表 10 局 游戏 

40 

频 

数 全 时 个 整 
30 每 - 币 都 是 i 

站 数 ， 因此 第 3 级 的 长 


方形 范围 为 2.5 至 3.5 。 


我 们 需要 求 出 玩 游 戏 的 总 局 数 ， 也 就 是 说 ， 要 求 出 总 频数 。 
总 频数 等 于 每 个 长 方形 的 面积 之 和 . 因此 ， 我们 要 用 每 个 长 方形 的 宽度 乘 以 该 长 方形 的 频数 密度 ， 得 
出 频数 ,然后 将 所 有 频数 相 加 . 





总 频数 =10 十 30 十 50 十 30 十 20 


一 140 
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直方 图 着 非 元 所 不 能 


尽管 直方 图 在 显示 分 组 数值 型 数据 方面 表 
现 出 色 ， 但 还 有 几 种 数值 型 数据 用 直方 图 
表现 并 不 理想 ， 比 如 不 断 在 原 有 总 和 上 增 
加 新 值 而 得 出 的 “累计 总 和 ”……… 













我 真希 望 能 够 一 眼看 出 有 有 多少 人 次 游 戏 时 间 少 于 
基 个 数字 。 比 必 ， 我 不 要 看 有 多 少 人 的 游戏 时 间 
在 3-5 小 时 以 内 ， 而 要 男 一 张 图 体现 有 和 多少 人 的 
游戏 时 间 少 于 5 小 时 ， 行 得 通 吗 ? 
让 我 们 看 看 能 不 能 帮 帮 首席 执行 官 。 下 
面 是 我 们 曾经 画 过 的 直方 图 : 


每 天 游戏 时 间 
pT 


> 表示 1000 天 






通过 直方 图 我 们 可 以 看 出 将 灾 租 的 频数 密 
度 至 寺 有 多 少 闹 家 兵 洲 戏 时 间 几 于 某 个 
将 定时 间 ， 图 中 表现 得 并 刀 是 特别 清末 。 


码 册 泗 涉 
Ww 
© 
© 
局 


1000 

8 

0 1 3 5 10 24 
要 在 这 张 图 中 一 眼看 出 各 项 累计 总 和 ， 颇 需要 费 一 番 周 折 。 小 时 


为 了 求 出 游戏 时 间 在 5 小 时 以 内 的 玩家 的 频数 ， 我 们 需要 将 各 
种 频数 加 起 来 。 我 们 需要 另 一 种 图 形 ……- 哪 一 种 呢 ? 


CX) 
7 坊 动脑 
LA 


你 认为 我 们 该 在 图 上 显示 哪些 信息 呢 ? 该 画 哪 些 信息 ? 请 写 下 答案 。 
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ee 重要 统计 量 
首席 执行 官 项 望 有 某 种 图 形 能 向 他 显示 某 个 特定 值 以 内 的 频数 | ss， | 2Z 


之 和 一 累积 频数 。 提 到 累积 频数 这 个 术语 时 ， 我 们 基本 上 指 {| 





的 是 累计 总 和 ( 向 原来 的 总 和 中 增加 新 值得 出 的 总 和 ) 。 ”累积 频数 
我 们 需要 画 出 这 样 的 图 ， 用 横 轴 表 示 时 间 〈 小 时 ) ， 用 纵 轴 表 累加 到 某 个 数值 为 止 网 总 频 
示 累 积 频数 。 通 过 这 张 图 ， 首 席 执行 官 就 能 取 一 个 值 ， 并 从 图 数 。 基本 上 是 所 有 频数 的 累 


上 读 出 到 这 个 数值 为 止 的 相应 累积 频数 。 他 将 能 求 出 游戏 时 间 计 总 和 ， 
在 5 小 时 内 、6 小 时 内 或 他 最 感 兴趣 的 任意 小 时 内 的 人 数 。 


在 动手 画图 之 前 ， 我 们 需要 知道 到 底 要 在 图 上 画 些 什么 一 我 们 
需要 计算 已 知 的 每 个 区 间 的 累积 频数 ， 还 要 求 出 每 个 区 间 的 上 限 。 


让 我 们 看 看 数据 ， 开 工 ! 


部 么 ， 困 积 频数 姨 多 少 ? 


首先 ， 让 我 们 假定 首席 执行 官 需要 画 出 1 小 时 以 内 的 累积 频数 〔 或 者 
叫 总 频数 ) 。 只 要 我 们 看 看 数据 就 知道 ，0 一 1 组 的 频数 是 4300、 还 
能 看 出 1 是 该 组 的 上 限 。 即 ， 在 1 小 时 以 内 ， 累 积 频数 为 4300。 


接 下 来 ， 看 看 3 以 内 的 总 频数 。 我 们 已 知 0-1 组 和 1~3 组 的 频数 ，3 
是 又 一 个 上 限 。 为 了 求 出 3 以 内 的 总 频数 ,我 们 将 0 一 1 组 和 1 一 3 组 内 
的 频数 加 起 来 。 


看 出 某 种 模式 了 吗 ? 如 果 我 们 取 每 个 组 的 上 限 ( 小 时 ) ,将 这 个 上 
限 以 内 的 各 个 频数 相 加 ， 就 能 求 出 至 该 上 限 为 止 的 总 频数 ， 以 此 类 
推 ， 得 出 : 















0 

: Ee = 一 | 

3 so 3 |4soor6so=ll2o | 
35 |490%0 |s |4300r6900r4900=16100 | 
S10 |200 |'1o |4300r6900r4900+2000=1a100 | 
110724 J|2100 |24 |4300+6900+4900t2000+2100=20200 | 
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制 系 各 累积 频数 决 不 
既然 已 经 有 了 各 个 上 限 和 累积 频数 ,我 们 就 能 在 图 上 画 出 这 些 数 据 会 减 小 。 
了 。 画 两 条 轴 ， 纵 轴 代 表 累 积 频数 ， 横 轴 代 表 小 时 数 。 画 好 后 ,根据 | 
土 限 及 与 之 对 应 的 累积 频数 画 出 各 个 点 ， 然 后 用 一 条 线 将 这 些 点 连 起 : 只 要 发现 累积 
来 ， 如 下 图 : 频数 开始 减 小 ， 就 应 检查 
计算 方法 是 否 正 确 。 
游戏 时 间 累 计 总 和 
22500 
20000 
17500 
15000 4 和 和 黑 积 
加 12500 a 
频 10000 颖 款 18.100 对 放风 沁 。 
数 7500 
5000 
2500 
2 0 5 10 15 20 25 
到 据 愉 黑 名 屯 数 _A 


必 及 久生 


首席 执行 官 想 让 你 求 出 人 们 在 线 游戏 时 间 在 4 小 时 以 内 的 发 生 次 
数 。 看 看 能 不 能 用 累积 频数 图 估计 这 个 值 。 
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动 动笔 种 答 及 俐 上 没有 和 盆 疝 题 


以及 过 特 
下 解答 


15000 
12500 
10000 
7500 
5000 
2500 
0.0 






13750 


问 : 


签 :类 个 教 值 的 累积 频数 即 到 这 
个 数值 为 止 (包括 这 个 数值 在 内 ) 的 
频数 总 和 。 通 过 累积 频数 可 知 到 该 
教 值 点 为 止 的 总 频数 。 

例如 ， 假 设 你 有 一 些 人 的 年 龄 数据 。 


数值 27 的 累积 频数 表示 到 27 岁 (和 包 
括 27 岁 在 内 )】 为 止 的 人 有 多 少 。 


什么 是 昧 积 频数 ? 


冰 :累积 频数 只 是 用 于 分 组 数据 
吗 ? 
等 : 完全 不 是 。 累 积 频 数 可 以 用 


于 任何 数值 型 数据 。 关 键 是 ， 你 想 
知道 的 是 到 某 人 特定 数值 为 止 的 总 
频数 ， 还 是 对 特定 数值 的 频数 更 感 
兴趣 。 
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钨 此 ， 疙 们 在 机 轴 上 找到 4， 
点 ， 状 后 读 出 弘 轴 上 的 桐 训 累积 频数 。 


由 此 捍 出 答案 约 为 13,750。 
收 时 池内 的 约 有 13.750 决 ， 


世上 没有 傻 问 题 


阅 :有 些 图 形 可 以 在 一 张 图 上 显 
示 多 批 数 据 。 累 积 频数 图 行 吗 ? 


个 : 可 以 。 在 累积 频数 图 上 可 以 
这 样 做 : 为 每 一 批 数 据 绘制 一 条 单 
独 的 线条 。 人 例如， 如果 你 起 按 性 别 
比较 际 积 频数 ， 就 可 以 画 一 条 线 表 
未 男 性 ， 另 画 一 条 线 表 示 女 性 。 将 两 


条 线 画 在 同一 张 图 上 效果 会 好 得 多 ， 


可 以 更 容易 地 比较 两 批 数 据 。 


问 : 


数目 是 否 


在 同一 张 图 上 绘制 的 线条 的 
受到 限制 ? 


答 : 没有 什么 特别 的 限制 ， 这 完 
全 取决 于 你 的 数据 。 但 图 上 线条 过 
多 会 显得 拥挤 ， 这 时 无 法 在 图 上 读 
出 累积 频数 ， 也 无 法 比较 各 个 批 次 
的 数据 ， 因 此 不 要 画 过 多 的 线条 。 


首席 执行 官 想 让 你 求 出 人 们 在 线 游戏 时 间 在 4 小 时 以 内 的 发 生 次 
数 。 看 看 能 不 能 用 累积 频数 图 估计 这 个 值 。 






找到 这 个 数值 与 图 线 的 到 







摘 言 之， 在线 六 戏 时 间 在 4 







阅 :请 提醒 一 下 我 ， 如 何 求 出 某 
个 数据 的 累积 频数 ? 


签 ; 可 以 直接 从 轩 上 读 出 累积 频 
数 : 在 模 轴 上 找到 要 求 其 累积 频数 
的 数值 ， 找 到 这 个 数值 与 囚 积 频数 
曲线 的 交点 ， 然 后 从 准 轴 寺 读 出 累 
积 频数 的 数值 。 


各 :如 果 已 知 票 积 频数 ， 能 通过 
图 形 求 出 相应 的 数值 吗 ? 


答 : 能 。 在 纵 轴 上 找到 要 求 其 数 
值 的 累积 频数 ， 找 到 这 个 累积 频数 与 
累积 频 教 曲线 的 交点 ， 然 后 读 出 相应 
宽 灿 教 值 。 


第 一 印象 


在 芒 芒 游戏 公司 的 主题 报告 中 ， 首 席 执 行 官 想 说 明 他 要 如 何 定位 特定 的 年 龄 组 。 他 有 显示 年 
E33 习 龄 累积 频数 的 累积 频数 图 ， 但 他 同时 需要 显示 频数 。 可 一 只 狗 吞 吃 了 写 有 这 些 频数 的 纸张 。 
看 看 你 是 否 能 用 累积 频数 图 估计 出 每 个 组 的 频数 。 


这 里 的 上 限 为 18， 内 为 某 人 以 进入 17 突 弄 贻 到 年 
湛 '8 光 为 由 坎 蕉 当 作 17 岁 年龄 通常 向 下 取 丈 ， 





年 龄 小 于 某 个 特定 年 龄 的 玩家 数 

10000 

7500 
累 

积 。 50o0 
频 
数 

2500 

0.0 

10 20 30 40 50 60 70 80 90 100 
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在 芒 芒 主题 报告 中 ， 首 席 执行 官 想 说 明 他 要 如 何 定位 特定 的 年 龄 组 。 他 有 显示 年 龄 累积 频数 
的 累积 频数 图 ， 但 他 同时 需要 显示 频数 。 可 一 只 狗 吞 吃 了 写 有 这 些 频数 的 纸张 。 看 看 你 是 否 
能 用 累积 频数 图 估计 出 每 个 组 的 频数 。 





7 ro 008s00900 
ao jw ls |%s009400710 





ALR 维 然 赂 有 课 普 也 不 用 担心 ， 册 当 前 累积 频 整 六 去 
时 和 频数 ， 这 些 只 是 估计 合 ， 之 区 的 丸和 手数 ， 本 
可 部 出 当前 频数 
年 龄 小 于 某 个 特定 年 龄 的 远 家 数 
10000 
7500 
时 
是 5000 
数 
2500 
0.0 
0 10 20 30 40 50 60 70 80 90 100 
年 龄 组 
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选择 正确 的 图形 


首席 执行 官 对 你 绘制 的 累积 频数 图 满意 极 了 ， 你 的 奖金 即将 落 袋 为 安 。 他 已 
经 快 完 成 主题 报告 的 准备 工作 ， 只 差 最 后 一 图 : 芒 芒 公司 与 主要 竞争 对 手 利 
润 对 比 图 。 他 该 用 哪 种 图 呢 ? 


下 面 是 首席 执行 官 有 可 能 用 到 的 两 张 图 。 你 的 任务 是 辨析 这 两 张 图 ， 
旨 | 对 每 张 图 的 相对 优 缺 点 发 表 看 法 。 你 将 选择 哪 张 图 ? 


利润 ( 美元 ) 


国 芒 芒 公司 
国 竞争 对 手 


2003 2004 2005 2006 


利润 ( 美元 ) 


2004 2005 
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(h ) 稀 过 


( 山 ) 涤 弛 


40 


下 面 是 首席 执行 官 有 可 能 用 到 的 两 张 图 。 你 的 任务 是 辨析 这 两 张 图 ， 对 每 张 图 的 相对 优 缺 


国 芒 芒 公司 
辆 竞争 对 手 





钳 习 点 发 表 看 法 。 你 将 选择 哪 张 图 ? 
解答 
利润 ( 美元 ) 

600 

500 

400 

300 

200 

100 

0.0 

2003 2004 2005 2006 2007 
年 度 
利润 ( 美元 ) 

600 

500 

400 

300 

200 

100 

0 
2003 2004 2005 2006 2007 
年 度 

起 攀比 条 和 形 图 “ 汶 它 前 伯 
ee 条 形 转 也 录用 担心 记 就 算 
” 形 职 尖 于 所 要 强调 本 要 事 昌 
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这 张 条 形 图 按 年 度 对 利润 进行 了 很 好 的 比 
较 ; 若 想 比较 同一 年 度 的 利润 ， 这 张 图 也 
非常 棒 。 例 如 ， 我 们 可 以 看 出 ， 在 2007 
年 以 前 ， 竞 争 对 手 的 利润 较 高 ， 但 到 了 
2007 年 ， 芒 芒 公司 的 利润 超过 了 对 手 。 


这 张 图 的 缺点 是 ， 如 果 首 席 执行 官 突然 
决定 在 图 中 添加 第 三 家 竞争 对 手 的 数据 ， 
读 图 难度 可 能 会 增加 ， 人 们 难以 一 眼看 
明白 这 张 图 。 


wl 于 
一 竞争 对 手 


这 张 “折线 图 ”更 好 地 体现 出 每 家 公司 的 
年 度 利 润 趋势 。 两 家 公司 的 趋势 线 都 很 明 
确 ， 我 们 很 容易 就 能 看 出 他 们 的 利润 模式 : 
芒 芒 公司 的 利润 聆 升 顺 利 ， 而 竞争 对 手 的 利 
润 则 开始 放 缓 。 同 时 ， 很 容易 就 能 添加 另 一 
家 公司 的 数据 ， 这 不 会 让 图 形 面目 不 清 。 


缺点 是 ， 虽 然 也 能 够 对 年 度 利 润 进行 比较 ， 
但 不 如 条 形 图 清晰 。 


折线 图 能 很 好 地 体现 数据 趋势 。 你 将 每 一 批 数据 画 成 点 ， 然 后 将 这 些 点 连 起 来 。 
就 可 以 方便 地 在 同一 张 图 上 显示 多 批 数 据 ， 却 不 会 显得 过 于 拥挤 一 只 要 确保 能 
清楚 地 看 出 每 一 条 线 就 行 了 。 


像 其 他 图 形 一 样 ， 在 纵 轴 上 显示 频数 还 是 百分数 由 你 选择 一 使 用 哪 种 标 度 完全 
取决 于 你 想 凸 显 的 主要 事实 。 


折线 图 常用 于 显示 随时 间 变 化 的 数值 。 时 间 总 是 用 横 轴 表示 ， 频 数 用 纵 轴 表 示 。 
通过 在 横 轴 土 选 择 时 间 值 ， 可 以 读 出 任何 时 间 段 内 的 频数 ， 还 能 读 出 该 时 间 点 的 
相应 频数 。 


利润 ( 美元 ) 


2004 2007 
年 度 


这 条 赵 势 线 没 二 


意义 一 -要 是 重新 
折线 图 应 只 用 于 展现 数值 型 数据 ， 不 应 用 于 才 列 一 下 类 别 还 会 是 这 个 神子 名， 


类 别 数据 。 原 因 是 ， 对 类 别 数 据 进行 比较 是 


有 意义 的 ， 但 为 其 绘制 趋势 线 却 没 有 意义 。 
只 有 在 基于 某 些 数值 型 单位 ( 比如 时 间 ) 对 
类 别 进行 比较 时 才 使 用 折线 图 ， 这 时 . 每 一 
类 别 都 用 一 条 独立 的 线 表示 。 
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区 点 及 也 上 没有 傻 问题 


人 


累积 频数 即 到 某 个 特定 数值 为 止 的 总 频数 ， 即 频数 


的 累计 总 和 。 


通过 累积 频数 图 ， 
上 限 。 


需要 体现 趋势 时 请 使 用 折线 图 ， 
趋势 。 


可 用 折线 图 显示 多 批 数据 。 每 批 数据 各 用 一 条 线 表 


阅 ;折线 图 和 时 间 序列 图 是 一 回 
事 吗 ? 我 想 我 以 前 听 到 过 这 个 名 字 。 


签 : 时间 序 列 图 确实 是 一 种 折线 
图 。 时 间 序列 图 以 时 间 区 间 为 关注 
点 ， 我 们 用 过 的 一 些 实例 就 是 这 祥 
的 。 但 折线 图 不 一 定 要 关注 时 间 。 


阅 :折线 图 有 什么 特别 的 变 体 吗 ? 


答 ， 有 。 事 实 上 ,你 已 经 通 到 过 
一 种 。 系 积 频 教 图 就 是 一 种 折线 图 ， 
所 显示 的 是 到 某 个 特定 值 为 止 的 总 
频数 。 


42 深入 浅 出 统计 学 


可 基于 累积 频数 找 出 每 组 数据 的 





示 ， 请 确保 能 清楚 识别 每 一 条 线 。 


由 于 通过 折线 图 很 容易 看 出 趋势 形状 ， 因 此 可 用 折 


线 图 进行 基本 的 预测 。 只 要 延长 趋势 线 即 可 进行 预 


测 ， 但 要 尽量 保持 基本 形状 。 


例如 基于 时 间 的 a 


不 要 使 用 折线 图 显示 类 别 数 据 一 除非 要 显示 每 一 


个 类 别 的 趋势 ， 例 如 基于 时 间 的 趋势 。 如 果 要 显示 


世上 没有 傻 头 题 


阅 ; 折线 图 既 能 显示 类 别 数据 ， 
又 能 显示 数值 型 数据 吗 ? 


答 : 折线 图 显示 类 别 数据 的 情况 
只 有 一 种 ; 只 显示 每 一 类 别 的 趋势 ， 
且 每 条 线 代表 一 个 类 别 。 


折线 图 不 应 该 用 于 这 种 情况 : 基于 
类 别 绘制 线条 。 


阅 : 这么 说 在 显示 总 体 趋 势 时 ， 
折线 图 效果 葛 好 ; 在 对 数值 或 类 别 进 
行 比较 时 ， 条 形 图 效果 更 好 ? 


答 : 正确 。 使 用 哪 种 图 形 归 根 结 
底 在 于 你 要 续 递 的 信息 ， 以 及 你 要 
提炼 的 主要 事实 。 


每 一 个 类 别 的 趋势 ， 要 为 每 一 个 类 别 画 一 条 线 。 





问 ， 既然 我 已 经 知道 如 何 正确 创 
建 图 形 ， 我 能 用 绘图 软件 完成 这 项 
繁重 的 工作 吗 ? 


人 答 : 完全 可 以 1 给 图 状 件 能 为 你 
节省 大 量 时 间 ， 减 少 莹 重工 作 ， 而 且 
结果 非常 出 色 。 


但 要 记 住 ， 软件 无 法 代替 你 思考 。 你 
仍然 需要 决定 哪 种 图 能 最 好 地 体现 你 
的 主要 事实 ， 还 必须 检查 软件 所 生成 
的 结果 是 否 正 是 你 盼望 得 到 的 。 


FNn 安 


第 一 印象 


二 一 > 
蕊 蕊 公司 征 服 游 戏 市 场 ! 
在 你 的 帮助 下 ， 芒 芒 公 司 有 了 杀手 铜 ， 主 题 报 告 极为 成 功 ， 这 都 是 你 的 功劳 。 
芒 芒 游戏 名 声 大 噪 ， 赞 助 、 广 告 纷 至 省 来 。 你 唯一 要 做 的 就 是 想 一 想 拿 着 大 
把 的 奖金 干 点 什么 ， 玩 点 什么 
统计 学 让 你 受益 、 对 事情 知 根 知 底 。 你 已 经 初 尝 甜 头 ， 接 着 读 下 去 吧 ， 我 们 
将 让 你 看 到 统计 学 能 完成 更 多 工作 ， 你 将 真正 开始 让 统计 学 发 光 发 热 。 













这 些 图 真是 籽 样 的 ! 投资 
人 在 我 们 的 办 公 室 门口 排 
起 了 长 队 。 去 度 个 长 假 吧 ， 
我 请 客 ! 
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大 家 说 我 打 高 尔 夫 

只 有 平声 水 平 ， 我 倒 要 
让 他 们 看 看 ， 我 这 个 平均 和 
他 们 那个 平均 未 一 样 。 


有 时 候 ， 把 握 问 题 核心 才 是 当务之急 。 


从 一 大 堆 数 字 中 看 出 模式 和 趋势 可 能 颇 为 不 易 ， 而 求 出 平均 数 往往 是 把 握 全 局 
的 第 一 步 。 有 了 平均 数 就 能 迅速 找 出 数据 中 最 具 代 表 性 的 数值 ， 得 出 重要 结论 。 
在 本 章 中， 我 们 将 介绍 几 种 方法 ， 帮 助 你 计算 最 重要 的 统计 量 一 均值 、 中 位 
数 、 众 数 。 你 将 开始 学 习 如 何 有 效 地 汇总 数据 ， 尽 可 能 得 出 简练 、 有 用 的 结果 。 
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统计 邦 健身 俱乐部 使 用 平均 数 


欢迎 来 到 健身 俱乐部 


统计 邦 健 身 俱 乐 部 深 感 自豪 ， 因 为 他 们 有 一 项 本 事 一 


能 为 每 一 位 客户 提供 完美 无 缺 的 健身 课程 。 无 论 你 要 学  - 人 篇 人 
游泳 、 练 武术 ， 还 是 要 打造 型 体 ， 他 们 总 有 合适 的 课程 身 1 人 立 
等 着 你 健 具 乐 部 


i h 襄 
健身 俱乐部 的 员工 注意 到 ， 当 客户 与 同龄 人 在 同一 个 班 统计 邦 顶 级 养生 馆 


上 练习 时 ， 表 现 最 为 开心 ， 而 开心 客户 更 常 做 回头 客 。 
看 来 ， 健 身 俱 乐 部 要 取得 成 功 ， 秘 诀 在 于 算出 每 个 班 的 
典型 年 龄 ， 其 中 一 个 办 法 就 是 计算 平均 数 。 平 均 数 是 每 
个 班级 的 代表 年 龄 ， 利 用 这 个 年 龄 ， 健 身 俱乐部 可 以 帮 
助 客 户 选 择 合适 的 班级 。 


下 面 是 力量 集训 班 现 有 学 员 : 





我 们 如 何 计算 力量 集训 班 的 平均 年 龄 ? 
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中 庸 之 道 


均值 ， 平均 数 的 一 般 量 度 


可 能 以 前 有 人 让 你 算 过 平均 数 。 计 算 大 和 量 数据 的 平均 数 的 一 个 方法 是 : 将 所 有 
数字 加 起 来 ， 然 后 除 以 数字 个 数 。 


在 统计 学 中 ， 这 样 算出 来 的 值 叫做 均值 。 







叫 平 雯 数 博 什么 未 要 吗 ? 
我 习惯 这 样 叫 ， 


原因 是 平均 数 不 止 一 种 。 

你 必须 知道 如 何 分 别称 呼 每 一 种 平均 数 ， 才 能 方便 地 告诉 别人 你 所 
说 的 是 哪 一 种 平均 数 。 就 像 去 杂货 店 买 面包 ， 你 不 也 得 告诉 售货员 
要 买 哪 一 种 面包 吗 ? 一 白面 包 、 全 表面 包 或 其 他 面包 。 考 虑 到 这 一 
点 ， 最 好 明确 指定 所 用 的 是 娜 一 种 平均 数 计算 方法 ， 例 如 ， 当 你 所 
写 社会 学 研究 报告 时 ， 就 应 该 这 样 做 。 


同 理 ， 如 果 有 人 告诉 你 某 个 数据 集 的 平均 数 ， 当 知道 该 平均 数 的 种 
类 后 ,你 将 能 更 好 地 理解 数据 的 真实 情况 。 这 能 给 你 重要 线索 ， 让 
你 得 知 所 传递 的 是 何 种 信息 一 或者， 在 某 种 情况 下 ,会 让 你 得 知 
所 隐匿 的 是 何 种 信息 。 


我 们 先 讲 均值 ， 随 后 在 本 章 后 面部 分 介绍 其 他 类 型 的 平均 数 。 
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均值 数学 


如 果 你 想 真正 成 为 统计 高 手 ， 就 需要 把 一 些 常 用 统计 符 
号 用 顺手 。 一 开始 可 能 会 感觉 有 点 儿 生 疏 ， 但 很 快 就 会 习 
惯 的 。 





字母 与 数字 


几乎 每 一 种 统计 算法 都 涉及 一 批 批 数字 的 加 法 计算 。 例 如 ， 如 
果 我 们 想 求 出 力量 集训 班 的 年 龄 均值 ， 首 先 就 要 把 班 上 全 体 学 
员 的 年 龄 加 起 来 


统计 师 的 问题 是 如 何 用 通用 方法 表示 这 种 算法 。 我 们 不 一 定 事先 
知道 有 多 少数 字 要 处 理 ， 也 不 一 定 知道 都 有 哪些 数字 。 例 如 ， 我 
们 目前 知道 力量 集训 班 有 多 少 人 ， 知 道 他 们 的 年 龄 ， 可 要 是 有 其 
他 人 加 入 ， 结 果 会 怎么 样 ? 只 有 用 通用 方法 表示 以 上 算法 ， 才 有 
办 法 在 班级 情况 发 生变 动 时 ， 不 用 重新 推导 ， 就 能 写 出 算法 。 


统计 师 是 这 样 解决 以 上 问题 的 : 用 字母 表示 数字 。 例 如 ， 他 们 
可 能 会 用 字母 x 表 示 力 量 集训 班 中 的 学 员 年 龄 ， 如 下 所 示 : 


班级 学 员 特 定年 龄 班级 学 员 通 用 年 龄 
19 20 20 20 21 一 X, X, X, X, X, 
每 个 x 表示 班级 中 的 一 个 人 的 年 龄 ， 有 点 儿 像 用 特定 数字 x 对 p> 
每 个 人 做 标记 一 样 。 a 
中 攀 一 个 。 
我 们 用 x 表示 这 个 女 纺 的 年 龄 RCR 了 
此 今年 19 岁 ， 可 是 ， 就 芷 地 到 了 既然 我 们 已 经 有 了 表示 年 龄 的 通用 方法 ， 就 能 
20 岁 ， 我 们 还 是 认为 邮购 年 冷 就 用 x 进行 各 种 计算 。 可 以 以 下 列 方式 表示 班级 


未 用 重新 推导 位 何 计算 从 。 中 的 5 个 人 年 龄 的 总 和 : 








Sum =X,+X,+X,+X,+X, 


多 少 人 该 怎么 办 ? 
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可 要 是 我 们 不 知道 有 多 少数 字 需 要 求 和 该 
怎么 办 ? 例如 ， 要 是 我 们 不 知道 班级 中 有 


中 席 之 道 


处 理 未 知 条件 


统计 师 用 字母 表示 未 知 数字 。 可 如 果 我 们 不 知道 有 多 少数 字 需 要 求 和 该 怎 
么 办 ? 没 问题 一 我 们 只 要 把 这 些 数 字 的 数目 叫做 n 就 可 以 了 。 例 如 ， 如 果 
我 们 不 知道 力量 集训 班 中 有 多 少 人 ， 我们 就 说 有 n 个 人 ， 然 后 将 年 龄 和 写 为 : 


Sum = Xi; + X, + X3 十 X4 十 Xs 十 … 十 X， 


在 本 例 中 ，x ,表示 班 上 第 n 个 人 的 年 龄 。 如 果 班 上 有 18 个 人 ， 则 这 个 数 是 x ， 
即 第 18 个 人 的 年 龄 










把 这 些 x 多 部 写 出 素 
看 上 二 插 虽 劲 儿 的 …… 


我 们 可 以 用 另 一 种 简捷 表示 法 。 

Xi + X, +X ++X+.… +X 这 种 写法 有 点 儿 像 在 说 “年 龄 1 加 年 龄 
2， 再 加 年 龄 3， 然 后 加 年 龄 4， 依 次 类 推 ， 直 到 加 到 年 龄 n。” 
在 日 常 交流 中 ， 我 们 不 太 可 能 这 么 说 ， 而 更 可 能 说 “把 所 有 
年 龄 加 起 来 ”， 这 样 更 直接 、 更 简单 、 切 中 要 点 。 





; 
| 与 此 相似 ， 在 数学 中 ， 我 们 可 以 用 三 符号 表示 这 个 意思 ，z 
| 为 希腊 字母 ， 读 作 “ 西 格 玛 ”。 我 们 可 以 用 x ( 读 作 : 西 





8 格 玛 x ) 简捷 地 表示 “将 所 有 的 x 加 起 来 ”。 
D 


Xi; 十 X, 十 X; 十 X, 十 Xs 十 .十 X ,一 之 x 


看 到 了 吧 ， 多 直接 、 多 简单 啊 ! 这 就 是 “把 所 有 数值 加 起 
来 ”的 数学 表示 方法 ， 不 用 明确 说 出 每 个 数值 。 


讲 过 这 些 方便 简单 的 数学 表示 法 之 后 ， 让 我 们 看 看 怎么 用 
这 种 数学 表示 法 计算 均值 。 
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均 秆 公式 


再 说 均值 


我 们 可 以 用 数学 符号 表示 均值 。 


为 了 求 出 一 批 数字 的 均值 ， 我 们 会 将 这 些 数字 加 起 来 ， 然 后 除 以 
这 些 数 字 的 个 数 。 我 们 已 经 讲 过 如 何 记 总 和 ， 还 讲 过 统计 师 如 何 
用 n 来 表示 一 批 数字 的 总 和 。 
把 以 上 记 法 合并 起 来 ,均值 就 可 以 记 为 : 
把 所 上 的 数 
es 然后 除 以 数 
室 个 数 . 


也 就 是 说 ， 这 就 是 “将 所 有 的 数字 加 起 来 ， 然 后 除 以 数字 个 
数 ” 的 简捷 数学 表示 法 。 


均值 的 寺 半 符号 


均值 是 应 用 最 广泛 的 统计 量 之 一 。 由 于 使 用 如 此 频繁 ， 统 计 师 们 

专门 给 了 它 一 个 符号 : 上 。 这 是 一 个 希腊 字母 ( 读 作 “ 缪 ”) 。 

记 住 ， 这 只 是 表示 均值 的 一 种 简捷 方法 。 均值 是 应 用 最 广泛 的 
统计 量 之 一 ， 可 用 符 
号 上 表示。 











我 是 均值 。 有些 人 说 我 
是 平声 数 ， 但 实质 上 ， 
我 叫 场 值 ， 


50 深入浅出 统计 学 


中 庸 之 道 







试 着 算 一 下 力量 集训 班 的 年 龄 均值 ? 下 面 是 学 员 们 的 年 龄 。 


心 羽 已 笔 
SEE、 
年内 |I9 |2 2 
下 种 年 瞧 的 人数 3| 颇 数 ”|1 |3 |1 | 





案件 : 含 含糊 糊 的 平均 数 
本 地 一 家 公司 的 员工 由 于 感到 自己 拿 到 的 薪水 不 公道 ， 出 
现 了 不 满 情 绪 。 大 部 分 员工 周 薪 为 500 美 元 ， 少 数 经 理 高 一 
些 ， 而 首席 执行 官 每 周 搞 回 家 49,000 美 元 。 
5 人 分钟 “这 公司 的 平均 薪水 是 每 周 2,500 美 元 ， 而 我 们 只 有 500。” 
工人 们 说 ，“ 这 不 公平 ， 我 们 要 加 薪 。” 
准 班 光 四 一 位 经 理 耳 闻 了 这 个 情况 ， 也 和 他 们 一 起 要 求 加 
: 薪 。“ 这 公司 的 平均 薪水 是 每 周 1 万 美元 ， 而 我 只 有 
4,000。 我 要 加 薪 。” 
首席 执行 官 看 着 他 们 ， 说 道 : “你 们 都 错 了 ， 平均 薪水 就 
是 500 美 元 一 周 ， 我 没 亏 待 谁 ， 快 回去 干 活 吧 。” 
平均 薪水 是 怎么 回 事 ?” 你 认为 谁 是 对 的 ? 
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均值 与 频数 


、 泌 乙 荡 
解答 


为 了 圳 出 上 ， 我 们 需要 把 所 有 人 的 年 龄 加 起 来 ， 巩 后 除 必 人数。 即 : 


19 十 20 十 20 十 20 十 之 i 
5 


100 “也 售 ， 有 3 个 人 网 


= 一 一 务 论 为 20 岁 . 










试 着 算 一 下 力量 集训 班 的 年 龄 均值 ”下面 是 学 员 们 的 年 龄 。 


有 ID 
mm | | [1 























年 座 坪 们 为 20， 


处 理 频 数 


在 计算 一 批 数 据 的 均值 时 ， 你 常常 会 发 现 有 些 数 字 是 重复 的 。 只 要 看 
看 力量 集训 班 的 年 龄 就 知道 ， 实 际 上 有 3 个 人 的 年 龄 是 20 岁 。 


有 一 点 确实 很 重要 : 在 计算 均值 的 时 候 ， 要 把 每 个 数 的 频数 考虑 进去 。 
为 了 确保 自己 不 忽略 这 一 点 ， 我 们 可 以 把 它 写 入 公式 。 


如 果 用 f 代 表 频 数 ， 就 可 以 重新 将 均值 表示 如 下 : 


每 个 数 富村 以 其 频数 . 
罗 fy ”各 将 全 部 条 各 要 加 ， 


RH 上 
> 


这 是 表示 均值 的 另 一 种 方法 ,但 这 次 明确 指出 了 频数 。 用 这 个 方法 计算 
力量 集训 班 的 数据 ， 得 出 : 


lx 19+3x 20+1 x 21 
上 = 一 一 
5 
= 20 
计算 方法 相同 ， 但 写法 略 有 区 别 。 
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中 良 之 道 


再 说 健身 俱乐部 


又 一 位 顾客 满怀 希望 地 前 来 寻找 完美 无 缺 的 健身 班 。 你 
能 帮 他 找 一 个 吗 ? 











我 想 找 一 个 周二 晚上 的 路 ， 要 安静 恪 
人 ， 要 能 遇 到 同龄 人 . 你 能 帮 我 安排 安 
排 吗 ? 


听 起 来 这 很 容易 找到 。 根 据 宣 传 手 册 ， 健 身 俱 乐 部 周 
-有 三 个 班 有 空缺 。 第 一 个 班 的 年 龄 均值 是 17， 第 二 
个 班 的 年 龄 均值 是 25， 第 三 个 班 的 年 龄 均值 是 38。 这 
位 克 莱 夫 先生 需要 找到 一 个 学 员 平均 年 龄 贴近 他 本 人 
年 龄 的 班级 


C8 看 看 每 个 班 的 年 龄 均值 。 克 莱 夫 应 加 入 哪 
个 班 ? 
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ji- Lo 二 
当 好 的 夫人 二 


人 人 都 在 练功 夫 


克 菜 夫 去 了 年 龄 均值 为 38 岁 的 班 。 他 盼望 这 是 一 个 程度 一 般 
的 班级 ， 他 可 以 在 这 里 进行 一 些 不 太 剧烈 的 练习 ， 遇 到 一 
年 龄 相仿 的 朋友 。 遗 憾 的 是 ……… 










我 结束 了 功夫 族 鬼 学习 ， 那 剖 
上 有 系 岁 小 伙 久 和风 位 祖 病 苑 。 
再 报 焉 的 话 绝 和 处 会 再 来 这 里 。 








"重要 统计 量 
ey 均值 


哪里 出 错 了 ? 


克 菜 夫 曾经 盼 着 加 入 的 班级 原来 主要 由 十 几 岁 
学 员 组 成 。 你 觉得 为 什么 会 出 现 这 种 情况 呢 ? 


我 们 需要 查看 数据 ， 探 明 究 竞 。 让 我 们 看 看 ， 
草 绘 一 个 数据 图 ， 看 是 否 有 助 于 找 出 问题 所 在 
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中 庸 之 道 


绘制 功夫 班 和 力量 集训 班 的 直方 图 ( 若 要 复习 直方 图 ， 请 参考 第 一 章 ) 。 直 方 图 的 分 布 形状 
比较 下 来 结果 如 何 ? 克 莱 夫 为 什么 会 被 分 到 错误 的 班级 ? 


力量 集训 班 学 员 年 龄 


年 龄 ( 岁 ) [19 |20 [21 | 


mw | [3 | 
功夫 班 学 员 年 龄 

EEIN OIE EI TAT 
mw ;lo ll | 
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练习 解答 


绘制 功夫 班 和 力量 集训 班 的 址 方 图 ( 若 要 复习 直方 图 ， 请 参考 第 一 章 ) 。 直 方 图 的 分 布 形状 
比较 下 来 结果 如 何 ? 克 菜 夫 为 什么 会 被 分 到 错误 的 班级 ? 


力量 集训 HE 学 员 年 具 

年 龄 ( 岁 ) |19 |20 |21 
频数 | 31 
功夫 班 学 员 年 龄 


Fs) To [0 1 Ts Ti] 
mmx | le [sl | 


力量 集 洲 琴 滨 员 第 鼓 





18 19 20 21 22 23 年 的 ( 岁 ) 





招 了 节省 空间 ， 0 
申 去 0 一 18 穴 信息 ,一 一 
荔 赤 对 学 员 年 齿 
6 3 
频 4 | :> 
数 > 这 
0 Yk 
0 19 20 21 22 145 146 147 148 年龄 ( 岁 ) 


你 认为 均值 会 是 一 批 数据 中 的 最 大 值 吗 ? 在 什么 情况 
下 会 是 这 样 ? 
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中 认 之 道 


我 们 的 数据 中 存在 异常 值 


看 出 力量 集训 班 和 功夫 班 的 图 形 形 状 有 何 差别 了 吗 ? 力量 集训 
班 的 年 龄 形成 了 光滑 、 对 称 的 形状 ， 很 容易 看 出 班 上 学 员 的 典 
型 年 龄 。 


功夫 班 的 图 形 形 状 则 不 这 么 直截了当 。 大 部 分 年 龄 都 在 20 岁 左 
右 ， 但 有 两 位 祖师 从 的 年 龄 远 远 超过 20 岁 。 像 这 样 的 极 值 被 称 


为 异常 值 。 
功臣 更 党 其 每 就 
考 上 大 部 分 演员 的 年 
浴 都 在 20 岁 右 省 . 
过 里 的 年 办 是 失常 值 ， 作 罗 设 1 
它们 与 整体 数据 并 未 十 分 协 下。 





OO LN 居中 


0 19 20 21 22 145 146 147 148 年龄 ( 岁 ) 


沪 值 泊 38， 但 绩 上 没有 一 个 
人 嵩 年龄 在 33 上 下 ， 这 个 年 
认真 风能 代表 亚 级 年 抢 吗 ? 


如 果 这 个 班 上 不 包括 几 位 祖师 和 耸 ， 均 值 会 是 多 少 ? 将 


该 均值 与 实际 均值 进行 比较 。 你 会 因此 得 知 异 常 值 有 
何 影响 ? 
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认识 异常 值 
异常 什 
真 包 是 公 
观察 功夫 班 的 数据 和 图 形 ， 很 容易 看 出 班 上 学 员 的 年 龄 在 20 岁 
左右 。 事 实 上 ， 如 果 班 上 没有 那 几 位 祖师 爷 ，20 岁 就 是 均值 






重要 统计 量 
~ 异常 值 


但 我 们 不 能 简单 地 忽略 那 几 位 祖师 和 爷 : 他 们 仍然 是 班 上 的 一 分 


子 。 遗 憾 的 是 ， 这 几 位 明显 高 于 “典型 ”年 龄 成 员 的 存在 扭曲 了 与 其 他 数据 格格 未 入 的 极 
均值 ， 使 均值 抬 高 了 。 高 或 极 低 的 数值 


功夫 班 学 员 年 龄 





山 果 没有 那 几 位 钥 病 和， 
场 值 会 出 现在 这 附近 ， 






如 果 将 那 几 位 往 郑 车 
2 的 年 龄 包含 在 向 ， 均 
2 向 活 偏 秒 ， 
4 i 7 Dn 值 会 向 契 


“| 年 妥 统 计量 


-rr | 


Pa 


全、 仿 利 数据 


当 异 常 值 将 数据 向 左 或 向 
右 “ 拉 ”时 即 产 生 偏 儿 数据 





上 一 38 
你 能 看 出 异常 值 如 何 拉 高 均值 吗 ? 这 就 是 异常 值 对 数据 的 影响 。 
一 旦 发 生 这 种 情况 ， 我 们 就 说 数据 偏 斜 了 。 
功夫 班 的 数据 向 右 偏 斜 ， 原 因 是 ， 如 果 按 照 升 序 排列 所 有 数据 ， 
异常 值 位 于 右边 。 
让 我 们 仔细 看 看 。 


必 荔 邑 和 


» 解 管 你 认为 均值 会 是 一 批 数据 中 的 最 大 值 吗 ? 在 什么 情况 下 会 是 
这 样 ? 











是 的 ， 会 有 这 种 情况 。 果 一 批 数据 中 的 所 有 数据 都 相同 ， 则 均值 会 是 最 大 值 。 
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自 右 偏 儿 


向 右 偏 斜 的 数据 有 一 条 “尾巴 ”， 这 条 尾巴 | 
由 偏 大 异常 值 形成 ， 向 右 逐 渐变 弱 。 拿 一 张 右 大 前 分 教 什 帮 和， 
偏 斜 图 形 看 看 ， 就 能 看 到 这 样 的 尾巴 。 功 夫 ep 
班 中 的 偏 大 异常 值 扭曲 了 均值 ， 将 均值 拉 高 多 和 这 是 异常 值 


了 一 一 即 拉 向 了 右边 。 i 和 


向 左 偏 余 


这 张 图 上 的 数据 向 左 偏 斜 。 看 到 左 侧 的 异常 值 尾巴 了 吗 ? 
这 次 的 异常 值 位 于 低 端 ， 把 均值 向 左 拉 。 在 这 种 情况 下 ， 
均值 小 于 大 部 分 值 。 


对 称 数 据 


在 理想 情况 下 ， 你 会 希望 数据 呈 对 称 形态 。 如 果 数 
据 对 称 ， 则 均值 位 于 中 央 。 不 会 有 任何 异常 值 将 


这 里 的 数据 是 对 和 的 ， 
均值 拉 向 任何 一 侧 ， 中 央 位 置 两 侧 的 数据 形状 大 臻 汤 值 未 受 异常 值 影响 ， 


相同 。 
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均值 对 话 


饮水 机 人 边 的 对 活 





60 
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您 好 ， 克 菜 夫 ! 我 听 说 你 报 了 功夫 强 . 


这 真是 太 让 人 意外 了 


克 菜 夫 : 他 们 告诉 我 这 个 班 的 平均 年 龄 是 38 岁 ， 所 以 我 觉得 
自己 能 跟 上 。 我 坚持 了 5 分 钟 就 不 得 不 坐 下 ， 要 不 我 的 腿 就 不 
听 使 唤 了 

本 迪 姑 娘 : 但 我 没 看 到 这 个 班 上 有 任何 人 是 这 个 年 龄 ， 所 以 
他 们 的 算法 肯定 有 差错 。 他 们 为 什么 会 那样 跟 你 说 呢 ? 


克 莱 夫 : 我 觉得 不 是 他 们 的 算法 有 错 : 他 们 只 是 没 把 我 真正 
需要 知道 的 情况 告诉 我 。 我 问 他 们 班 上 的 典型 年 龄 是 多 少 ， 
而 他 们 给 我 的 是 年 龄 均值 ，38 

本 迪 姑 娘 : 那 并 不 是 真正 的 典型 值 ， 对 吗 ? 我 是 说 ， 仅 看 班 
上 那些 人 的 话 ， 我 会 认为 较 年 轻 的 年 龄 更 具 代 表 性 


克 莱 夫 : 要 是 他 们 把 几 位 祖师 和 爷 从 算法 中 剔除 掉 ， 我 就 会 知 
道 不 该 去 这 个 班 。 原 因 就 在 这 儿 ， 我 确信 无 疑 。 他 们 把 整个 
算法 都 扭曲 了 

本 迪 姑 娘 : 好 吧 ， 如 果 几 位 祖师 爷 引 起 了 这 么 大 的 问题 ， 他 
们 为 什么 不 忽略 这 几 位 祖师 爷 呢 ? 也 许 这 样 能 得 出 更 有 代表 
性 的 班级 年 龄 ……… 


中 僻 之 道 


寻找 中 位 数 


当 偏 斜 数据 和 异常 值 使 均值 产生 误导 时 ， 我 们 就 需要 用 其 他 方式 
表示 典型 值 。 我 们 可 以 取 中 间 信 ， 这 种 做 法 切实 可 靠 。 中 间 值 是 


为 了 求 出 功夫 班 的 中 位 数 : 比如 某 个 功夫 班 按 升 序 排 列 所 有 年 龄 ， 
取出 中 间 值 ， 如 下 所 示 : 


19 19 20 20 20 21 21 100 102 


这 是 中 竟 交 数字 ， 

即 中 倍数 ，20， 
如 果 把 功夫 班 上 的 所 有 年 龄 按 升序 排列 起 来 ， 数 值 20 正 好 在 当 中 位 数 永 远 处 于 
中 。 因 此 ， 功 夫 班 的 中 位 数 为 20。 中 间 ， 它 是 个 中 
要 是 班 上 学 员 数目 为 偶数 该 怎么 办 呢 ? 间 值 。 


19 20 20 20 21 21 100 120 


个 
此 累 魂 上 党 员 数 目 为 偶数 . 
唱 中 国 数 并 看 公有 一 个 . 


如 果 一 批 数字 的 数目 是 偶数 ， 则 只 要 取 两 个 中 间 数 的 均值 即 可 
(将 两 个 中 间 数 加 起 来 ， 再 除 以 2 ) ， 结 果 就 是 中 位 数 。 在 上 例 中 ， 


人 动 芳 脐 


我 们 已 经 看 到 ， 如 果 有 9 个 数 ， 则 中 位 数 是 处 于 第 5 个 位 置 的 数 ; 如 果 有 8 个 数 ， 则 中 
位 数 是 处 于 第 4.5 个 位 置 〈 第 4 位 和 第 5 位 中 间 ) 的 数 。 要 是 有 n 个 数 呢 ? 
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分 步 计 算 中 位 数 


求 中 位 数 三 步 法 : 


1,， 按 顺序 排列 数字 : 从 最 小 值 排 列 到 最 大 值 。 


Z. 如 果 有 奇数 个 数值 ， 则 中 位 数 为 位 于 中 间 的 数值 。 如 
果 有 h 个 数 ， 则 中 间 数 的 位 置 为 (n*+1)/2。 


3， 如 果 有 偶数 个 数值 ， 则 将 两 个 中 间 数 相 加 ， 然 后 除 以 


2Z。 中 间 位 置 的 算法 是 : 


(n+ 和 /2Z。 两 个 中 间 数 分 别 


位 于 这 个 中 间 位 置 的 两 侧 。 





世上 没有 俐 问题 


阅 :如果 确 实 想 用 均值 ， 哪 怕 存 在 偏 科 数据 ， 还 能 用 吗 ? 


签 ; 可 以 用 , 而且 大 家 经 常 这 么 做 。 不过， 这 时 均 
值 无 法 最 恰当 地 体现 典型 值 。 你 需要 使 用 中 位 数 


问 : 这 是 你 的 看 法 ， 但 均值 的 主要 意义 的 确 是 给 出 典 
型 值 ， 均 值 是 个 平均 数 。 


签 :均值 带 来 的 巨大 危险 是 : 它 会 给 出 一 个 不 存在 于 
数据 集中 区 的 数值 。 以 功夫 班 为 例 : 如 果 你 要 加 入 这 个 
班 ， 并 随机 挑 出 一 个 人 ,很 可 能 这 个 人 是 在 20 岁 左右 ， 因 
为 班 上 大 多 数 人 的 年 龄 都 在 20 岁 左右 一 -只 看 均值 无 法 形 
成 这 种 印象 ， 求 出 中 位 数 会 让 你 对 数据 有 更 准确 的 预期 ， 





但 即使 是 中 位 数 ， 有 时 也 会 得 出 不 存在 于 数据 集中 区 的 
值 ， 上 一 页 的 例子 就 是 这 样 。 这 正 是 出 现 多 种 平均 数 的 
原因 ， 有 时 候 ， 为 了 正确 地 指出 典型 值 ， 需 要 使 用 各 种 
各 样 的 方法 。 


62 深入 浅 出 统计 学 


| 间 :这 么 说 中 位 数 比 均值 更 好 ? 


答 : 有 时 候 中 位 数 比 均值 更 合适 ， 但 这 并 不 是 说 它 
更 好 。 大 多 数 时 候 ， 你 会 需要 使 用 均值 ， 因 为 均值 的 优 
势 通常 远 胜 中 位 数 ， 均 值 对 于 抽样 数据 来 说 更 稳定 。 本 
书后 文 会 继续 阐述 这 一 点 


| 辣 : ”对 于 类 别 数据 该 怎么 使 用 均值 或 中 间 值 呢 ? 对 于 
一 些 实例 ， 像 第 1 章 第 9 页 中 的 数据 ， 该 怎么 办 ? 

答 :你 只 能 求教 值 型 数据 的 均值 和 中 位 数 。 不 过 别 担心， 
还 有 一 种 平均 数 可 以 处 理 这 种 问题 ， 我 们 随后 会 展开 讲 。 


| 间 :我 总 是 搞 不 清 右 偏 斜 数据 和 左 偏 作 数 据 。 怎 样 才 
能 记 住 哪 是 右 偏 斜 ， 哪 是 左 偏 余 ? 


答 : 偏 儿 数据 有 一 条 “异常 值 ”尾巴 。 若 要 知道 数据 
的 偏 余 方向， 可 看 看 尾巴 的 指向 。 例 如 ， 右 偏 斜 数据 的 
尾巴 指向 右 方 。 


化 身 为 数据 


请 假装 成 数据 来 玩 达 个 游戏 ， 说 一 说 每 
二 个 数据 集 的 中 位 数 是 哪 一 个 、 数 据 是 否 


于 和 偏 和 针 、 均 值 是 大 于 还 是 小 于 中 位 数 。 
垃 请 说 出 理由 。 





A 


中 康之 道 
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化 身 为 数据 解答 


化 身 为 数据 


有 请 假装 成 数据 来 玩 达 个 游戏 ， 说 一 说 每 
上 个 数据 集 的 中 位 数 是 哪 一 个 、 数 据 是 否 
偏 余 、 均 值 是 大 于 还 是 小 于 中 位 数 。 


请 说 出 理由 。 





£ 
% 


< 疙 


数值 |1|2|3|4|5 le |7 ls 
I sl ws | | kk, 


这 里 有 25 个 数 ， 册 果 把 这 些 数 朱 列 起 来 ， 中 位 数 正 好 在 中 间 ， 即 在 第 
13 个 数 的 位 置 ， 中 位 数 为 3;， 数据 向 右 偏 斜 ， 均 值 镍 拉 高 因此， 均值 
大 于 中 位 数 . 


数值 |1 |4 |e Js |9 [10 [1 2 
mv II1 1 2 ls [4 J4 Js Js 


这 里 网 中 位 数 和 为 10， 数 据 向 左 偏 儿 ,均值 被 拉 向 左边 ， 因 此 ， 均 值 小 


于 中 位 数 . 
尼 果 数据 向 右 偏 任 ， 则 均值 出 果 数 据 向 左 偏 儿 ， 则 均值 
位 于 中 位 数 右 侧 ( 狼 大 ) . 位 于 中 位 数 左 侧 (部 小 ) ， 





中 位 数 
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生意 日 益 兴 隐 
尔 对 平均 数 的 研究 的 确 得 到 了 回报 ， 越 来 越 多 的 人 前 来 健身 俱乐部 
挑选 健身 班 ， 员 工 们 发 现 ， 为 客户 们 挑选 合适 的 班级 变 得 容易 多 了 。 


这 位 十 几 岁 的 小 青年 正在 找 游泳 班 ， 他 想 在 班 上 交 一 些 年 龄 相仿 
的 新 朋友 。 





你 们 的 青少年 洲 泳 赣 
听 起 来 非常 棒 ! 马上 给 
我 报名 吧 ， 







游泳 班 的 年 龄 均值 是 17， 巧 的 是 ， 这 正 是 中 位 数 ， 
听 上 去 ， 这 个 班 对 于 他 来 说 再 合适 不 过 了 。 


“\e/® 
健身 俱乐部 


统计 邦 顶 级 养生 馆 


中 位 数 年 龄 : 17 





让 我 们 看 看 故事 的 发 展 …… 


中 庸 之 道 


第 2 章 ”集中 趋势 的 量度 。 65 


当 好 的 中 间 值 变 坏 


小 鸭 听 听 游 泳 班 

小 鸭 吓 听 游 泳 班 每 周 在 游泳 池 里 碰头 两 次 。 在 这 里 ， 家 长 们 孝 
他 们 的 小 宝宝 学 游泳 ， 大 家 玩 水 嫌 戏 ， 乐 不 可 支 。 

看 看 谁 来 上 课 了 …… 










站 仁 ! 
你 的 富 室 呢 ? 






信心 考 考 你 


你 认为 这 一 次 又 是 哪里 出 差错 了 呢 ? 
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中 庸 之 道 


掉 落 的 频数 磁 贴 


下 面 是 参加 小 鸭 吸 吸 游 泳 班 的 成 员 的 年 龄 ， 但 有 一 些 写 有 频数 的 磁 贴 
掉 下 来 了 。 你 的 任务 是 将 这 些 频数 放 回 频数 表 中 的 正确 位 置 。 参 加 这 
个 班 的 有 9 个 孩子 及 其 父母 ， 均 值 和 中 位 数 都 是 17 。 





EE | 2 3 li la aa 
频数 | | 2 hh | 1 


口 已 


忆 汉 义 写 


弄 浅 楚 小 鸭 叫 听 游 泳 班 的 频数 后 ， 画 出 直方 图 。 你 注意 到 什么 了 ? 
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练习 解答 


挤 洋 的 频数 磁 贴 


下 面 是 参加 小 芍 嘎 听 游 泳 班 的 成 员 的 年 龄 ， 但 有 一 些 写 有 频数 的 磁 贴 
掉 下 来 了 。 你 的 任务 是 将 这 些 频数 放 回 频数 表 中 的 正确 位 置 。 参 加 这 
个 班 的 有 9 个 孩子 及 其 父母 ， 均 值 和 中 位 数 都 是 17 。 


均值 为 17。 如 果 载 们 用 a 和 b 表 示 未 知 频数 ， 则 ， 
x x x x2 十 32a 十 33b 
已 知 有 9 个 编 子 ， ps Bb 32a+ 336 _ 


的 频数 加 起 来 肯定 是 9. 两 边 都 乘 ， ‘218, 18 
定 有 4 个 2 岁 的 孩子 i 0 
324 二 +330 二 306- (3 十 8 十 6 十 62)=306-79 











32a 十 33b 三 227 
由 于 32a 十 33b 是 奇数 ， 所 以 0 肯定 是 3，4 肯 定 是 4， 


和 弄 清楚 小 鸭 嘎 听 游 泳 班 的 频数 后 ， 画 出 直方 图 。 你 注意 到 什么 了 ? 


小 鸣 吸 吸 班 的 学 员 年 龄 


2 刻 i 
六 里 有 组 数 这 里 又 有 
均值 和 中 位 

[ep 在 这 里 。 | > 


-组 数据 


| 
| 
| 


看 起 来 这 不 是 一 批 数 据 ， 而 是 两 批 : 一 批 是 父母 的 ， 一 批 是 孩 弛 的 。 
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中 唐 之 道 


雹 值 和 中 位 数 出 了 什么 问题 ? 
让 我 们 更 细心 地 看 看 情况 。 
下 页 是 参加 小 轴 听 叹 游 泳 班 的 成 员 的 年 龄 。 


11122223 3|31 31 32 32 32 32 33 33 33 
DD 
数字 个 数 为 偶数 、 国 此 中 位 数 
居于 3 和 31 当 中 . 取 这 岗 个 数 疯 
均值，(3+31)/2， 得 到 17， 


虽然 班 上 没有 一 个 人 是 17 岁 ， 但 这 个 班级 的 年 龄 均值 和 中 位 数 都 
是 17! 


可 如 果 班 上 人 数 是 偶数 会 怎么 样 呢 ? 均值 和 中 位 数 仍然 具有 误导 
性 。 请 看 : 
11122222 3(3)31 31 32 32 32 32 33 33 33 


加 果 闹 上 再 增加 一 个 2 岁 负 人， 则 中 
位 数 为 3。 那 么 成 年 人 又 怎么 解释 呢 ? 


如 果 班 上 再 增加 一 个 2 岁 的 孩子 ， 如 上 所 示 ， 中 位 数 仍然 是 3。 这 
反映 出 孩子 的 年 龄 ， 但 没有 将 成 年 人 考虑 在 内 。 


111222223 的 31313232 32 32 33 33 33 


风 果 我 们 在 王 极 中 再 增加 一 个 
31 岁 蚁 蕊 年 人 ， 中 位 数 就 会 变 为 
31， 这 一 次 ， 我 们 息 略 了 芒 凶 1 


如 果 再 在 班级 中 增加 一 个 33 岁 的 人 ， 则 中 位 数 变 为 31。 但 这 无 法 
反映 辛 上 所 有 孩子 的 情况 。 看 来 .无 论 我 们 选择 哪 一 个 值 作 为 平 
均 年 龄 ， 总 会 出 现 误导 。 


我 们 该 各 么 处 理 这 样 的 数据 呢 ? 
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动 动笔 


~ 区 







现在 请 认 认真 真 地 考虑 如 何以 最 佳 方式 表示 小 鸭 呀 哎 游 泳 班 的 
代表 年 龄 。 下 面 是 数据 提示 : 


抢 | |2 13 131 [32 [33 
频数 |3 |4 |2 |2 14 |3 | 










1. 为 什么 你 认为 均值 和 中 位 数 都 不 适用 于 这 些 数 据 ? 为 什么 均值 和 中 位 数 具 有 误导 性 ? 





2. 如 果 必 须 挑选 一 个 年 龄 来 代表 这 个 班级 的 年 龄 ， 这 个 年 龄 是 多 少 ? 为 什么 ? 





3. 要 是 能 挑选 两 个 年 龄 呢 ? 你 会 挑选 哪 两 个 年 龄 ? 为 什么 ? 
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中 良 之 道 


值 访谈 


本 周 话 题 : 


平均 数 的 各 种 形式 


Head First: 你 好 ， 平 均 数 ， 很 高 兴 遵 请 你 来 参加 


均值 : 拜托 ， 叫 我 均值 。 


Head First: 均值 ? 可 我 想 你 是 平均 数 。 我 们 搞 错 来 
宾 名 单 了 吗 ? 


均值 : 完全 没有 。 要 知道 ， 统计 邦 中 的 平均 数 不 目 
一 种 ， 我 是 其 中 一 种 ， 叫 作 均值 。 


Head First: 平均 数 不 止 一 种 ? 听 起 来 有 点 儿 复杂 。 


均值 : 其 实 不 复杂 ， 用 习惯 就 好 了 。 你 看 ， 我 们 都 
表示 一 批 数字 的 典型 值 ， 但 对 于 这 个 典型 值 是 多 
少 , 我们 各 有 各 的 看 法 。 


Head First: 那么 你 们 当中 谁 是 真正 的 平均 数 呢 ? 
我 说 的 是 把 所 有 数字 加 起 来 ， 然 后 除 以 数字 个 数 所 
得 到 的 那个 ? 

均值 : 是 我 。 不 过 请 别 叫 我 “真正 ”的 平均 数 ， 其 
他 兄弟 可 能 会 恼火 。 真 实情 况 是 、 大 多 数 刚 来 统计 
邦 的 人 都 把 我 当 作 “平均 数 先生 ”， 我 的 计算 方法 
和 学 生 们 在 基本 算术 中 首次 接触 平均 数 时 用 的 计算 
方法 相同 。 共 有 在 统计 邦 ， 我 才 叫 做 均值 ， 以 便 和 
其 他 类 型 的 平均 数 区 分 开 来 。 


Head First: 那么 你 有 其 他 名 字 吗 ? 


均值 : 说 起 来 我 确实 有 一 个 符号 : kh 。 所 有 的 摇滚 
明星 都 有 别名 ， 呢 ， 一 部 分 明星 有 别名 ， 好 的 我 也 
有 。 这 是 个 希腊 名 字 . 这 让 我 颇具 异国 情调 。 


Head First: 那么 为 什么 还 需要 别 的 平均 数 呢 ? 
均值 : 我 讨厌 承认 这 一 点 : 我 有 缺点 。 当 我 处 理 存 
在 异常 值 的 数据 时 ， 就 会 变 得 没 头 没 脑 。 没 有 异常 
值 的 时 候 ， 我 表现 很 好 ， 但 只 要 看 到 异常 值 ， 我 就 
会 失 魂 落魄 地 跟着 这 些 异 常 值 走 。 这 会 带 来 不 少 问 
题 。 有 时 候 我 会 远 远 偏离 大 部 分 数值 所 在 的 位 置 。 
这 时 就 该 请 中 位 数 出 面 了 。 

Head First: 中 位 数 ? 

均值 : 碰 到 异常 值 的 时 狂 ， 他 真是 太 冷 静 了 。 无 论 
你 砸 给 他 什么 数据 ， 他 总 是 能 端 端正 正 地 站 在 中 
间 。 尖 然 了 ， 中 位 数 有 他 不 好 的 一 面 : 他 无 法 计 
算 。 你 只 能 指出 他 应 该 出 现在 哪个 位 置 。 随 着 计算 
深入 ， 他 的 作用 会 有 所 逊色 。 

Head First: 你 们 二 位 有 数值 相等 的 时 候 吗 ? 
均值 : 如 果 数 值 是 对 称 的 ， 我 们 就 会 数值 相同 ， 春 
则 我 们 往往 不 相同 。 一 般 规 律 是 ， 如 果 存 在 异常 
值 ， 那 么 我 往往 朝 着 异常 值 移动 ， 而 中 位 数 则 停 在 
原来 的 地 方 不 动 。 

Head First: 时 间 快 到 了 ， 最 后 再 问 一 个 问题 : 会 
不 会 有 这 样 的 情况 ， 用 你 和 用 中 位 数 表示 典型 值 都 
会 出 现 问题 ? 

均值 : 恐怕 有 这 种 情况 。 有 时 候 我 们 需要 稍微 借助 
另 一 种 类 型 的 平均 数 。 他 露面 不 是 太 多 ,但 认识 认 
识 他 很 有 用 。 别 急 ， 我 将 让 你 看 看 他 都 从 些 什 么 。 
Head First; 好 极 了 1 
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现在 请 认 认真 真 地 考虑 如 何以 最 佳 方式 表示 小 鸭 呕 叹 游 泳 班 的 
代表 年 龄 。 下 面 是 数据 提示 : 


生擒 | 2 3 [31 [32 [33_ 
频数 |3 |4 |2|2 |4 [3 


1. 为 什么 你 认为 均值 和 中 位 数 都 不 适用 于 这 些 数据 ? 为 什么 均值 和 中 位 数 具有 误导 性 ? 


对 于 以 上 数据 ， 场 值 和 中 位 数 都 具有 误导 性 ， 闪 为 两 者 都 没有 人 金 面 表示 出 省 级 中 
的 成 员 的 黄 烈 年 龄 . 均 钉 说 明 有 一 些 十 几 岁 拘 青 窗 年 厅 加 了 了 潍 泳 殉 ， 案 际 上 一 个 
也 没有 ， 中 位 数 也 有 同样 曲 问 题 ， 但 如 果 有 别 的 人 加 入 碧 级 ， 中 倍数 会 大 幅度 
波动 ， 


2. 如 果 必 须 挑选 一 个 年 龄 来 代表 这 个 班级 的 年 龄 ， 这 个 年 龄 是 多 少 ?为 什么 ? 


的 确 未 太 可 能 搜 出 一 个 完 金 代表 路 级 年 龄 的 年 齿 ， 这 个 狗 级 实际 上 是 由 两 批 年 
龄 组 成 的 : 一 枇 是 防 台 的 年 龄 ， 一 礼 是 党 长 的 年 龄 。 确实 无 法 用 一 个 数 鹤 同 时 
代表 岗 批 年 龄 。 


3. 要 是 能 挑选 两 个 年 龄 呢 ? 你 会 挑选 哪 两 个 年 龄 ? 为 什么 ? 


由 于 这 些 数 据 看 上 去 包括 网 批 数 据 ， 挑 选 两 个 年 龄 来 代表 现 级 年 龄 是 有 意义 
的 ， 一 个 年 龄 代表 铁 耶 们 的 年 龄 ， 一 个 年 龄 代表 家 长 们 的 年 龄 。 我们 会 选 押 
2 和 32， 因 为 这 师 个 年 龄 组 的 成 员 最 多 ， 





72 深入 浅 出 统计 学 


认识 众 
ae 全 

除了 均值 和 中 位 数 ， 还 有 第 三 种 平均 数 ， 称 为 众 数 。 众 数 是 一 
批 数 字 中 最 常见 的 数值 ， 即 频数 最 大 的 数值 。 与 均值 和 中 位 数 
不 同 ， 众 数 必须 是 数据 集中 的 一 个 数值 ， 而 且 是 最 频繁 出 现 的 
数值 

有 时 候 ， 数 据 的 众 数 可 以 不 止 一 个 。 如 果 有 一 个 以 上 的 数值 具 
有 最 大 频数 ， 则 每 一 个 这 样 的 数值 都 是 众 数 。 如 果 数 据 看 上 去 
体现 了 多 种 趋势 或 多 批 数据 ， 那 么 我 们 就 为 每 一 批 数 据 给 出 一 
个 众 数 。 如 果 一 批 数据 有 两 个 众 数 ， 则 我 们 说 这 种 数据 是 双 峰 
数据 

这 正 是 我 们 在 小 鸭 嘎 鸣 游 泳 班 磁 到 的 情况 。 我 们 的 确 观 察 到 了 
两 批 数据 ， 一 批 是 家 长 的 ， 一 批 是 孩子 的 ， 因 此 不 存在 某 一 个 
能 完全 代表 整个 班级 的 年 龄 。 相 反 ， 我 们 可 以 看 出 每 一 批 年 龄 
的 众 数 。 在 小 鸭 啤 啤 游 泳 班 上 ， 年 龄 2 和 年 龄 32 出 现 的 频率 最 
高 ， 因 此 这 两 个 年 龄 都 是 众 数 。 从 图 上 看 ， 众 数 就 是 具有 最 高 
频数 的 年 龄 


众 数 甚至 能 用 于 类 列 数据 


众 数 不 仅 能 用 于 数值 型 数据 ， 还 能 用 于 类 别 数据 。 事 实 上 ， 
众 数 是 唯一 能 用 于 类 别 数据 的 平均 数 。 在 处 理 类 别 数据 时 ， 
众 数 是 最 常 出 现 的 平均 数 类 型 


你 还 可 以 用 众 数 指定 具有 最 高 频数 的 数值 组 
的 组 被 称 为 众 数 组 


众 数 甚至 能 周 于 类 别 数据 
国 开课 数 


具有 最 高 频数 


班 力量 集训 
功夫 
小 鸭 听 嘎 
0 2 4 6 8 10 12 14 16 18 
频数 








小 鸭 吸 吸 班 的 学 员 年 齿 
汶 是 众 数 具有 最 高 频 弛 
频 4 
数 3 
2 
1 
1 必 3 续 沁 亲 32 33 34 
相 2 gy 据 
+2 数 握 站 


w\e/™* 
健身 俱乐部 


统计 邦 顶级 养生 馆 
游泳 班 


中 位 数 年 龄 :全 7 
众 数 年 龄 : 2 和 32 
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分 步 计算 众 数 
求 众 数 三 步 法 : 
1 把 数据 中 的 不 同类 别 或 数值 全 部 找 出 来 。 


2. 号 出 每 个 数值 或 类 别 的 频数 。 


3. 挑 出 具有 最 高 频数 的 一 个 或 几 个 数值 ， 得 出 众 数 。 


求 出 以 下 几 批 数据 的 众 数 。 


换 数 |4 |5 ls fT lj3 | 


数 |1 |2 |3 |4 ls | 
频数 |2 |3 [3 [3 J | 


你 认为 众 数 在 什么 情况 下 最 有 用 ? 


众 数 在 什么 情况 下 最 无 用 ? 
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恭喜 ! 
尔 在 健身 俱乐部 的 辛勤 工作 正 迎 来 巨大 的 成 功 ， 要 求 报 班 的 人 我 的 高 尔 夫 得 
热情 高 分 均值 为 低 于 标准 杆 数 


2 杆 ， 未 过 可 别 告 诉 女 士 们 ， 
我 的 得 分 中 位 数 是 高 于 标准 村 


数 2 杆 。 
人 [2) 
我 跑 1 英里 所 用 


的 时 间 均 值 是 25 分 钟 ， 
不 过 这 包括 在 沿途 的 星 巴 
仕 加 咪 店 扣留 一 会 儿 的 











富有 经验 的 
网 球 教 练 ， 像 我 ， 
拿 到 的 中 位 数 薪 水 是 
33 闽 元 /小 时 。 







众 数 万 内 ! 弓 上 大 部 分 党 
员 都 和 我 年 龄 一 样 ! 














无 论 是 足球 还 是 
统计 学 ， 我 都 跑 它 
没商量 . 


我 每 场 曲棍球 比赛 平均 丢 
掉 7 晒 牙 . 





每 天 在 水 下 的 中 位 数 
时 间 24 分 钟 


求 出 以 下 几 批 数据 的 众 数 。 


4 [5 Ts [7 [8 ] 这 里 的 雁 数 是 2， 因 为 2 具有 最 
高 频数 . 


这 一 批 数 据 有 遇见 个 众 数 :， 2，3， 4, 5， 


你 认为 众 数 在 什么 情况 下 最 有 用 ? 


当众 数 网 数目 难 少 时 ， 或 者 ， 当 数据 为 类 基数 据 ， 而 不 是 
数值 型 数据 时 。 坊 信 和 中 位 数 都 未 能 用 于 类 副 数 据 ， 


众 数 在 什么 情况 下 最 无 用 ? 
当众 数 很 多 时 . 





重 受 统计 量 
众 数 


众 数 必须 存在 于 数据 集中 
众 数 是 唯一 能 用 于 类 别 数 据 
的 平声 数 . 
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中 康之 道 


填写 下 表 ， 针 对 我 们 在 本 章 遇 到 过 的 平均 数 ， 写 出 算法 ， 然 后 指出 在 哪 种 情况 下 会 使 用 哪 种 
平均 数 。 请 尽 最 大 努力 填写 ， 不 要 回头 翻阅 本 章 的 内 容 。 









计算 方法 何 时 使 用 


时 请 


梦 时 使 用 
| | 
| 
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练习 解答 





人 入 填写 下 表 ， 针 对 我 们 在 本 章 遇 到 过 的 平均 数 ， 写 出 算法 ， 然 后 指出 在 哪 种 情况 下 会 使 用 哪 种 
詹 习 平均 数 。 请 尽 最 大 努力 填写 ， 不 要 回头 翻阅 本 章 的 内 容 。 


和 解 


如 


在 数据 黑 常 对 种 ， 且 仅 里 示 出 一 种 站 
势 时 使 用 

六 为 每 一 个 

数值 


n 为 数值 数目 ， 
了 是 每 个 x 


2 人 AT 的 频数 ， 
2f 


糙 所 有 数据 按 赂 升 骸 顺 虞 进行 宰 列 。 册 | 在 数据 由 于 异常 值 而 发 生 偏 斜 时 使 用 。 
果 有 有 奇数 个 数值 ， 则 中 位 数 为 中 间 的 数 
值 ， 册 果 有 费 数 个 数值 ， 则 中 位 数 为 两 
个 中 则 的 数值 相 加 再 除 必 2 得 到 的 千林 ， 


这 出 具有 最 大 频数 曲 一 个 或 见 个 数值 。 | 在 过 到 类 别 数 据 时 健 用 . 
如 果 数 据 可 今 为 两 组 ， 则 为 惫 组 找 出 一 | 当 数 据 可 以 分 为 两 个 或 更 杀 组 时 使 用 。 


众 数 是 唯一 能 用 于 类 别 
数据 揭 卑 均 数 类 型 . 
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中 席 之 道 








AR 星 巴 仕 咖啡 连锁 店 慷慨 大 方 的 首席 执行 官 想 给 全 体 员 工 加 薪 。 他 不 太 确 
定 ， 是 直接 给 每 个 人 加 2,000 美 元 呢 ， 还 是 按 10% 的 比例 加 。 薪 水 均值 


为 50,000 美 元 ， 中 位 数 为 20,000， 众 数 为 10,000。 





3) 如 果 星 巴 仕 每 位 职员 都 加 薪 2,000 美 元 ， 均 值 、 中 位 数 和 众 数 都 会 发 生 哪些 变化 ? 


b) 如 果 星 巴 仕 每 位 职员 都 加 薪 10%， 均 值 、 中 位 数 和 众 数 都 会 发 生 哪 些 变化 ? 


cj 如 果 你 的 薪水 为 均值 ， 你 希望 采用 哪 种 加 薪 方 式 ? 如 果 你 的 薪水 等 于 众 数 呢 ? 
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中 Eb x 


、 动 埃 蕊 


管 星 巴 仕 咖啡 连锁 店 尺 慨 大 方 的 首席 执行 官 想 给 全 体 员 工 加 薪 。 他 不 太 确 

、 解 定 ， 是 直接 给 每 个 人 加 2,000 美 元 呢 ， 还 是 按 10% 的 比例 加 。 薪 水 均值 
为 50,000 美 元 ， 中 位 数 为 20,000， 众 数 为 10,000。 

a) 如 果 星 巴 仕 每 位 职员 都 加 薪 2,000 美 元 ， 均 值 、 中 位 数 和 众 数 都 会 发 生 哪 些 变化 ? 


场 值 : 此 果 x 代 表 原 来 拘 薪 水 ,代表 员工 数目 : 








SY(x + 2000) 均值 : 每 一 伤 新 水 都 增加 2,000 提 元 ， 
Mh 中 间 值 ( 即 中 位 数 ) 也 是 如 此 
诛 表 的 场 信 Bp nw wi a ( 即 中 位 数 ) 也 是 册 比 ， 新 的 中 
欧 有 nr 人 次 ， 伍 
一 x > 2 320 .000 十 92 .000 = $22 000 . 
二 50 000 + .2000w 他 个 人 的 薪水 都 增 。 众 数 ， 最 常见 揭 薪 水 (或 者 叫做 众 数 ) 
Ww 长 2,000 美 元 会 令 场 “为 10.000 里 元， 内 增加 2 .000 美 元 后 ， 
= 丰 52,000 值 、 中 位 数 和 众 数 。 众 数 灾 为 ， 


都 增长 2.000 盖 元 ， $10.000 十 $2000 = 312.000 


b) 如 果 星 巴 仕 每 位 职员 都 加 薪 10%， 均 值 、 中 位 数 和 众 数 都 会 发 生 哪 些 变化 ? 


一 次 ， 所 有 的 薪水 都 系 以 1.1 ( 即 100% 十 10%) 





均值 ; 2(1.1X) 
A 一 ee 中 位 数 ， 每 一 份 薪水 都 乘 以 1.1， 中 间 数 
( 即 中 位 数 ) 也 是 风 比 新 的 中 位 数 为 
bE ce 
三 $20 000 x 1.1 = $22.,000. 
JI 
二 00 众 数 ， 最 常见 揭 薪 水 (或 者 叫做 众 数 ) 为 
每 个 人 加 薪 10% , 则 = 丰 55.000 10000 间 元 ， 众 数 系 以 1.1 后 ， 亦 为 : 
均值 中 位 数 和 和 众 $10.000 x 1.1 = $11.,000 
数 也 增加 10%6 . 


Cc) 如 果 你 的 薪水 为 均值 ， 你 希望 采用 哪 种 加 薪 方 式 ?” 如 果 你 的 薪水 等 于 众 数 呢 ? 


如 果 你 拿 的 薪水 是 均值 ， 则 加 薪 10 色 的 加 薪 幅 度 更 大 : 加 果 你 拿 
的 薪水 是 众 数 ， 则 直接 加 薪 2,000 羡 元 的 加 薪 幅 度 更 大 。 
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中 讲 之 道 


破案 : 含 含糊 糊 的 平均 数 

平均 薪水 是 怎么 回 事 ? 你 认为 淮 是 对 的 ? 

工人 、 经 理 和 首席 执行 官 各 自用 了 不 同 的 平均 数 。 
工人 们 用 了 中 位 数 ， 这 使 得 首席 执行 官 的 薪水 造 5 分 循 
成 的 影响 达到 最 低 程度 。 


经 理 们 用 了 均值 。 首 席 执行 官 的 高 薪 令 数据 向 
右 编 竺 ， 均 值 因 此 显得 虚 高 。 


首席 执行 官 用 了 众 数 。 大 部 分 工人 的 薪水 为 每 
周 500 美 元 ， 所 以 500 美 元 就 是 薪水 的 众 数 。 


那么 , 谁 对 谁 错 ? 从 某 种 意义 上 说 ,他 们 都 是 对 的 ,但 我 们 不 
得 不 说 ， 每 一 个 人 群 都 在 使 用 最 有 利于 自己 意愿 的 平均 数 。 记 
住 ,统计 量 能 够 提供 信息 ， 但 也 能 造成 误导 。 权 得 再 三 ， 我 们 
认为 最 适合 用 于 本 案例 的 平均 数 是 中 位 数 ， 因 为 数据 中 存在 异 
常 值 。 
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3 分 散 性 与 变异 性 的 量度 
强大 的 “ 距 ” 








别 为 晚餐 担心 ， 妈妈。 只 要 有 
一 个 标准 差 更 低 的 烤箱 ， 您 就 
绝 示 会 再 烤 焦 位 何 食 物 了 . 


世事 可 靠 不 可 靠 ， 我 们 该 问 谁 ? 

平均 数 在 寻找 数据 集 典 型 值 方面 十 分 了 得 ， 但 平均 数 并 不 能 说 明 一 切 。 
平均 数 能 让 你 知道 数据 中 心 所 在 ， 但 若 要 给 数据 下 结论 ， 仅 有 均值 、 中 
位 数 和 众 数 往往 无 法 提供 充足 信息 。 在 本 章 中 ， 我 们 将 开始 分 析 各 种 距 
和 差 ， 让 你 的 数据 分 析 技 术 进 入 新 境界 。 
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招聘 : 队员 一 名 


统计 邦 全 明星 篮球 队 是 当地 和 炙手可热 的 篮球 队 ， 是 今年 联赛 
的 夺冠 热门 。 只 是 ， 由 于 一 场 离奇 的 意外 事故 ， 他 们 有 一 位 
队员 倒 下 了 。 他 们 需要 一 名 新 队员 ， 越 快 越 好 

新 队员 必须 是 全 才 ， 但 教练 真正 需要 的 是 一 位 靠得住 的 投 
得手。 只 要 球员 取得 他 的 信任 ， 使 他 相信 球员 有 了 能力 投 篮 得 
分 ， 他 就 会 成 为 篮球 队 的 一 员 

教练 整整 一 星期 都 在 试用 球员 ， 他 发 现 有 三 位 球员 可 以 考 
虑 。 问 题 是 ， 他 该 选择 哪 一 位 ? 











三 位 球员 的 投 艇 平均 得 分 相 
同 ， 但 我 需要 通过 某 种 办 法 
对 他 们 进行 筛选。 你 觉得 你 能 
帮 上 人 忙 吗 ? 










小 
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我 们 需要 比较 球员 得 分 


下 面 是 三 位 球员 的 得 分 : 





























每 场 比赛 的 得 分 |7 |a | 


9 ll2 3 
2 2 [2 1 








频数 










| Tel? lo |'" Ts Tw 
mw lh 


每 位 球员 的 得 分 均值 、 中 位 数 和 众 数 都 是 10 分 ， 但 只 要 你 注意 一 下 所 有 得 分 就 
会 发 现 ， 这 几 位 球员 是 以 不 同 的 方式 获得 这 些 成 绩 的 。 球 员 们 在 稳定 发 挥 方面 
存在 差异 ， 平 均 数 无 法 量度 这 一 差异 

我 们 需要 通过 某 种 方法 对 三 人 的 得 分 进行 分 析 ， 以 便 为 球 队 挑选 出 最 合适 的 人 
选 。 除 了 平均 数 ， 我 们 还 需要 用 其 他 方法 对 数据 进行 比较 一 用 哪 一 种 方法 呢 ? 


1 中 荔 泌 脑 
除了 平均 数 以 外 ， 还 有 哪 种 信息 会 帮助 教练 作出 
决定 ? 
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-人 
次 
> 
Yo 

I 


AN 
使 用 全 距 区 分 数据 集 rh 
频 通 这 观察 生 雹 款 可 ” 
前 面 讲 过 数据 集 平 均 数 的 计算 方法 ， 但 平均 数 往往 只 给 出 部 分 信息 。 平 数 硬度 数据 网 中 心 ， 
均 数 让 我 们 有 办 法 确定 一 批 数据 的 中 心 ， 却 无 法 知道 数据 的 变动 情况 。 
在 前 面 的 例子 中 ， 虽 然 每 一 位 球员 的 平均 得 分 相同 ， 但 显然 各 个 数据 集 


之 间 存 在 差异 ， 我 们 需要 通过 某 种 方法 量度 这 些 差 异 。 

我 们 可 以 观察 球员 得 分 相对 于 平均 数 的 分 散 情 况 ， 以 此 区 分 各 个 数据 集 。 
每 位 球员 的 得 分 分 布 情况 各 不 相同 ， 只 要 能 够 量度 这 些 得 分 的 分 布 情况 ， 
教练 就 能 够 做 出 更 有 依据 的 决策 。 





. ”得 分 


均值 对 于 我 们 了 解数 据 换 仿 


量度 全 距 茹 情况 意 无 帮助 ， 因 此 需要 
另 想 办 法 了 解数 据 分 散 情况 . 


通过 计算 全 距 (也 叫 极 差 ) ,我 们 可 以 轻易 获知 数据 分 散 情况 。 全 
距 指 出 数据 的 扩展 范围 有 点 儿 像 测量 数据 的 宽度 。 全 距 的 计算 方法 
是 : 用 数据 集中 的 最 大 数 减 去 数据 集中 的 最 小 数 。 


最 小 值 称 为 下 界 ， 最 大 值 称 为 上 界 : 
让 我 们 看 看 其 中 一 个 球员 的 得 分 ， 再 看 看 如 何 运 用 全 距 。 下 面 是 得 分 : 


78 99 10 10 11 12 13 






重要 统计 量 


1, | 
| 全 距 





为 了 计算 全 距 ， 我 们 用 上 界 减 下 界 。 从 数据 中 看 出 ， 最 小 值 为 7， 因 此 
这 是 下 界 ; 同样 可 以 看 出 上 界 ， 即 最 大 值 13。 用 上 界 减 下 界 ， 得 到 : 







全 中 = 上 界 -下 界 人 金 眶 也 叫 极 差 ， 是 用 于 
ys 量度 数据 集 分 散 程度 网 
所 以 该 数据 集 的 全 距 为 6。 上 界 - 下 界 





其 中 上 界 为 最 大 值 ， 


全 距 是 量度 数据 分 散 程度 的 既 简单 又 方便 的 方法 ， 于 是 ,我 们 有 了 下 界 为 最 小 值 


男 一 种 对 数据 集 进行 比较 的 方法 。 
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强大 的 “ 距 ” 





算出 下 列 数据 的 均值 、 下 界 、 上 界 、 全 距 ， 画 出 图 形 。 数 值 的 分 布 方式 相同 吗 ? 全 距 能 否 帮 


人 锣 习 助 我 们 描述 这 些 差异 ? 


分 | |9 | | | | 
9 数 [+ | | | fT 
分 | |9 | 1 2 | 
妖 数 |1 | | | LU 
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分 散 竹 与 受 究 性 的 识 度 


算出 下 列 数据 的 均值 、 下 界 、 上 界 、 全 距 ， 画 出 图 形 。 数 值 的 分 布 方式 相同 吗 ? 全 距 能 否 帮 
助 我 们 描述 这 些 差异 ? 


10.5 11.5 12.5 得 看 ， 数 据 各 不 相同 ， 
这 邮 入 算 竺 时 却 一 榜 ， 


10.5 11.5 
















以 上 呐 个 数据 集 明 人 金 距 相 同 ， 但 
数值 分 布 情况 却 有 有 差别 .我 在 起， 全 

距 是 苗 确 实 纪 含有 有 基数 据 分 散 情 况 隐 全 部 
信息 ? 


全 距 仅 仅 描 述 了 数据 的 宅 度 ， 并 没有 描述 数据 在 上 、 下 界 
之 闻 的 分 布 形态 。 

以 上 两 个 数据 集 都 具有 相同 的 全 距 , 但 第 二 个 数据 集 有 异常 
值 ( 即 极 大 值 和 极 小 值 ) 。 看 来 ， 全 上 距 能 量度 数值 的 展开 宽 
度 ， 但 很 难得 出 数据 的 真实 分 布 形态 。 
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异常 值 带 来 的 问题 


全 距 是 描述 数据 集 分 散 程度 的 简便 方法 ， 但 通常 并 非 描述 数据 
在 该 全 距 内 的 分 布 形态 的 最 好 方法 。 如 果 你 的 数据 中 包含 异常 
值 ， 那么 ， 使 用 全 曰 描述 数据 的 分 散 情况 会 极 具 误导 性 ， 原 因 
是 全 下 很 容易 受 异常 值 影 响 。 让 我 们 看 看 具体 情况 。 


假想 我 们 有 以 下 一 批 数据 : 
下 界 ; ee 


1112222333334444555 


这 里 的 数字 非常 均匀 地 分 布 在 上 界 和 下 界 之 间 ， 并 且 无 需 担心 
任何 异常 值 。 这 一 批 数据 的 全 距 为 4。 


可 要 是 增加 一 个 异常 值 ， 例 如 10. 会 发 生 什么 变化 呢 ? 


下 办 还 是 1。 但 上 办 增长 到 10， 
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下 界 保持 不 变 ， 人 得 上 界 增加 至 10， 于 是 新 全 距 为 9。 仅 仅 因 为 额 
外 增加 了 一 个 数 一 一 个 异常 值 ， 全 距 就 增长 了 5。 


没有 这 个 异常 值 的 时 各， 以 上 两 批 数 据 是 相等 的 ， 那么 ,我 们 对 
数值 分 布 形态 的 描述 为 什么 会 出 现 这 样 大 的 差别 呢 ? 


训 动 动能 







这 个 距 受 异常 值 影响 不 大 ? 


Mn 


hh wmw un 


你 能 不 能 想 个 办 法 ， 我 们 按照 这 个 办 法 构建 一 个 距 ， 使 


强大 的 “ 距 ” 


这 是 用 得 线 图 《条 形 图 的 一 
种 ， 但 用 线条 代替 长 方形 } 
表示 钢 数 据 ， 每 条 线 代 表 数 
据 集 中 蚁 一 个 数 鬼 频数 . 


/ 


1 23 4 5 





第 3 章 “分散 性 与 变异 性 的 量度 。 89 


90 


深入 浅 出 统计 学 








这 么 说 用 金良 未 是 个 
好 办 法 ? 


全 距 是 表述 数值 分 布 情况 的 一 种 极其 简单 方便 的 办 法 ， 但 颇 有 一 些 局 
限 性 。 

全 距 指 出 数据 最 大 值 和 最 小 值 之 间 的 差距 ， 但 仅 此 而 已 一 全 距 只 是 对 
数据 分 布 情况 极其 基本 的 描述 

全 距 的 主要 问题 是 : 仅仅 描述 了 数据 的 宽度 。 由 于 全 距 是 通过 数据 极 值 
计算 得 出 的 ， 因 此 不 可 能 指出 数据 的 真实 形态 以 及 数据 是 否 包 含 异 常 值 
构成 相等 全 距 的 途径 很 多 一 有 时 候 这 一 点 附加 信息 十 分 重要 










要 是 多 上 距 有 这 人 么 多 
限制 ， 大 家 为 什么 
用 它 呢 ? 


主要 原因 是 全 距 非常 简单 。 
全 距 如 此 简单 ， 大 家 都 能 理解 一 - 即使 很 少 接触 统计 
学 的 人 也 不 例外 。 例 如 ， 当 你 谈 起 年 龄 全 距 时 ， 大 家 
很 容易 就 能 理解 你 的 意思 。 

不 过 ， 请 小 心 ， 在 全 距 极其 简单 的 表象 下 却 潜伏 着 危 
机 。 由 于 全 距 无 法 反映 最 大 值 和 最 小 值 之 间 的 详细 情 
形 ， 使 用 时 很 容易 让 人 对 基础 数据 产生 误会 


强大 的 “路 " 


我 们 需要 授 脱 人 尼 常 值 


从 全 距 的 定义 可 以 看 出 ， 全 路 的 主要 问题 是 包含 异常 值 。 只 要 数据 中 有 异 
常 值 ， 即 使 只 有 一 两 个 ,全 距 中 就 会 包 合 这 些 异 常 值 。 我 们 需要 通过 某 种 
方法 消除 这 些 异 常 值 的 影响 ， 这样 才能 最 好 地 描述 数据 的 分 布 形态 。 


有 一 个 办 法 可 以 解决 这 个 问题 ， 即 使 用 所 谓 的 迷你 距 忽略 异常 值 。 我 们 不 
再 量度 整个 数据 集 的 全 距 ， 而 是 找 出 这 个 全 距 的 一 个 部 分 一 不 包含 异常 
值 的 部 分 。 


取 这 个 范围 


向 拘 数 值 。 











等 一 下 ,你 是 说 垢 们 要 假 
装 异 常 值 不 在 在 ? 这 所 起 
来 可 系 太 科学 ， 


我 们 需要 用 一 个 统一 的 方法 扬 虹 异 常 值 。 

如 果 随 心 所 欲 地 忽略 异常 值 ， 会 产生 这 样 一 个 问题 : 很 难 对 几 
个 数据 集 进行 比较 一 谁 知 道 是 不 是 所 有 数据 集 都 以 完 完全 全 
相同 的 方式 忽略 了 异常 值 ? 

我 们 需要 确保 这 一 点 : 对 要 进行 比较 的 几 个 数据 集 统 统 使 用 
相同 的 迷你 距 定义 。 如 何 办 到 呢 ? 
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分 全 效 与 四 他 拉丁 


外 分 位 数 出 手相 救 

构建 迷你 距 的 一 个 办 法 是 : 仅 使 用 数据 中 心 周边 的 数值 。 为 此 ， 首 先 按 升 

序 排列 数据 ， 然 后 将 这 些 数据 分 成 四 个 相等 的 数据 块 ， 每 一 个 数据 块 包含 这 各 和 薄 面 兄 到 这 网 
四 分 之 一 原 有 数据 。 同一 补 数 据 ， 丛 培 





ES 


我 们 可 以 用 介 于 两 条 外 分 割 线 之 间 的 数值 构建 一 个 距 。 





藤 这 两 信 值 之 半 鬼 闭 让 ， 我 们 就 
得 到 一 个 全 新 胸 “ 巡 你 距 


如 上 ， 起 到 将 整 批 数据 一 分 为 四 作用 的 几 个 数值 就 是 所 谓 的 四 分 位 数 。 有 一 些 教材 在 提 到 


求 四 分 位 数 的 方法 有 点 儿 类 似 求 中 位 数 ， 不 同 之 处 在 于 ， 需 要 求 出 将 四 分 位 数 时 ， 指 的 


整 批 数据 一 分 为 四 的 几 个 数值 ， 而 不 是 求 出 将 整 兹 数据 一 分 为 二 的 一 外 以 是 每 一 份 四 分 之 一 
个 数值 。 : ” ”数据 块 中 的 所 有 数 。 


我 们 不 是 这 样 。 我 们 用 术语 四 分 





最 小 的 四 分 位 数 ( Q1 ) 称 为 下 四 分 位 数 或 第 一 四 分 位 数 ， 最 大 的 四 分 
位 数 (Q3 ) 称 为 上 四 分 位 数 或 第 三 四 分 位 数 。 中 间 的 四 分 位 数 〈(Q2 ) 
就 是 中 位 数 ， 因 为 它 将 数据 一 分 为 二 。 每 两 个 四 分 位 数 之 间 的 距 被 称 
为 四 分 位 距 ( IQR ) 。 


位 数 特 指 将 整 批 数 据 一 分 为 四 的 
几 个 数值 。 


四 分 位 距 = 上 四 分 位 数 - 下 四 分 位 数 

四 分 位 距 为 我 们 提供 了 一 种 用 于 量度 数据 分 散 
程度 的 标准 的 、 可 重复 使 用 的 方法 ， 这 是 另 一 
种 能 对 数据 进行 比较 的 方法 。 但 异常 值 会 怎么 
样 呢 ? 四 分 位 距 也 能 帮助 我 们 处 理 异 常 值 吗 ? 
让 我 们 看 一 看 。 








相仿 位 数 是 这 样 一 些 数 值 ， 它 们 将 数据 一 
今 为 四 。 最 小 的 四 分 伞 数 称 为 下 四 分 们 
数 ， 最 大 绝 四 分 位 数 称 为 上 四 分 位 数 . 







中 间歇 四 分 位 数 即 中 位 数 ， 
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强 火 的 “路 


欠 分 位 距 噜 除 异 常 值 


四 分 位 距 的 优点 是 ; 与 全 距 相 比 ， 较 少 受到 异常 人 的 影响 。 


上 四 分 位 数 和 下 四 分 位 数 所 在 的 位 置 造成 了 这 样 的 结果 : 下 四 分 位 
数 以 下 还 有 25% 的 数据 ， 上 四 分 位 数 以 上 还 有 25% 的 数据 。 也 就 是 说 ， 
四 分 位 距 仅 使 用 了 中 间 50% 的 数据 ， 如 此 将 异常 值 弃 而 不 用 。 前 面 已 
经 讲 过 ， 异 常 值 就 是 数据 中 的 极 大 值 或 极 小 值 ， 因 此 ， 当 我 们 仅 考 
亏 数 据 中 心 周边 的 数值 时 ， 就 自然 而 然 地 将 异常 值 排除 在 外 了 。 


下 面 再 看 看 我 们 的 数据 。 能 看 出 四 分 位 距 如 何 有 效 地 忽略 异常 值 吗 ? 


四 分 位 度 包 括 中 国 段 的 数据 …… 













ee 
eh 一 数据 决 排除 在 从， 


由 于 四 分 位 距 仅 用 了 处 于 中 心 部 位 的 50% 的 数据 ， 因 此 ， 无 论 异 常 
值 是 极 大 值 还 是 极 小 值 ， 均 被 排除 在 外 。 异 常 值 不 可 能 处 于 中 心 部 


这 一 月 
位 一 这 意味 着 ,数据 中 的 所 有 异常 值 都 被 有 效 地 蓟 除了 异常 什 总 是 要 人 么 松 大 ， 要 么 要 


2 


\ 下 和 NX 
“重要 统计 量 
外 分 位 距 


即 一 个 示 易 受 异 常 僻 影 响 网 “ 述 你 
虐 ”。 可 通过 下 烈 方 法 进行 计算 ， 


上 四 分 倍数 一 下 四 分 位 数 






通过 四 分 位 距 将 异常 值 排除 在 外 的 意义 是 : 得 到 一 种 对 几 

个 数据 集 进行 比较 且 比 较 结果 不 会 被 异常 值 扭曲 的 办 法 。 

为 了 能 算出 四 分 位 距 ， 我们 必须 先 算出 四 分 位 数 。 请 翻 到 
一 页 ， 我 们 将 说 明 如 何 进行 计算 。 
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细 说 四 分 位 数 





害 析 四 分 位 数 

求 一 个 数据 集 的 四 分 位 数 的 过 程 与 求 中 位 数 的 过 程 非常 相似 。 如 果 将 所 有 数值 按 
照 升序 排列 ， 中 位 数 就 是 正好 位 于 中 央 的 数值 。 如 果 有 n 个 数 ， 则 中 位 数 是 位 于 
(n+1) :2 位 置 的 数值 ， 如 果 这 个 位 置 处 于 两 个 数字 之 间 ， 则 要 取 这 两 个 数 的 平均 值 。 
如 果 进 一 步 将 这 些 数 据 分 为 四 份 ， 四 分 位 数 就 是 处 于 每 个 分 割 位 置 的 数值 。 最 小 
值 为 下 四 分 位 数 ， 最 大 值 为 上 四 分 位 数 


Q1 Q2 Q3 
' 1 ， 1 
下 界 下 四 分 位 数 。” 中 位 数 。” 上 四 分 位 数 上 界 
求 四 分 位 数 的 位 置 比 求 中 位 数 的 位 置 稍微 坏 手 一 点 儿 ， 因 为 我 们 需要 确保 所 选择 
的 数值 能 按 正确 的 比例 划分 整 批 数据 。 不 过 还 是 有 办 法 的 : 让 我 们 从 下 四 分 位 数 
算 起 。 
求 下 由 分 位 数 的 位 置 
@ 首先 计算 n = 4-。 
和 四 如 果 结 果 为 整数 ， 则 下 四 分 位 数位 于 “n : 4” 这 个 位 置 和 下 一 个 位 
置 的 中 间 ， 取 这 两 个 位 置 上 的 数值 的 平均 值 ， 即 得 下 四 分 位 数 。. 
@ 。 如 果 “n :4” 不 是 整数 ， 则 向 上 取 整 ， 所 得 结果 即 为 下 四 分 位 数 的 
位 置 。 
例如 ， 如 果 你 有 6 个 数 ， 首 先 计算 6 4， 得 到 1.5， 向 上 取 整 得 到 2， 这 表示 下 
四 分 位 数 的 位 置 为 2。 
求 上 四 分 位 数 的 位 置 
@@ 。 首先 计算 3n :4。 
全 。 如 果 结果 为 整数 ， 则 上 四 分 位 数位 于 “3n = 4” 这 个 位 置 和 下 一 个 位 
置 的 中 间 ， 将 这 两 个 位 置 上 的 数 加 起 来 ， 然 后 除 以 2。 


四 。 如果“3n:4” 不 是 整数 ， 则 向 上 取 整 ， 所 得 到 的 新 数字 即 为 上 四 分 
位 数 的 位 置 。 


94 深入浅出 统计 学 


带 大 的 “ 距 - 


现在 该 实践 一 下 你 的 四 分 位 数 技术 了 。 下 面 是 某 位 球员 的 得 分 : 


每 场 比赛 得 分 |3 |6 |7 | [fs [3 | 





ECE EN ES EN CE ON 


1. 这 个 数据 集 的 全 距 是 多 少 ? 


2. 下 四 分 位 数 是 多 少 ? 上 四 分 位 数 是 多 少 ? 
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练习 解答 


下 面 是 某 位 球员 的 得 分 : 
习 
解答 每 场 比赛 得 分 3 |e 17 ll so 
妖 数 | ls 


1. 这 个 数据 集 的 全 距 是 多 少 ? 
这 个 数据 依 掀 下界 是 3， 办 为 3 是 最 低 得 分 数 。 上 界 是 30， 因 为 30 是 最 高 得 分 数 。 于 是 : 
全 距 = 上 界 - 下界 
=30~3 


= 27 


2. 下 四 分 位 数 是 多 少 ? 上 四 分 位 数 是 多 少 ? 
让 载 们 光 计 算 下 四 分 位 数 。 表 中 有 11 个 数 灾 ,11 二 4 二 2.75， 将 此 结果 向 上 取 整 可 得 米 
下 四 今 位 数 抬 位 置 ， 因 此 下 四 分 位 数 的 位 置 为 3， 这 意味 着 下 四 分 位 数 为 6。 


现在 让 我 们 囊 出 上 四 今 值 数 . 3 x 11 二 4 = 8.25， 将 此 结果 向 上 职 束 ,得到 9， 即 上 中信 
全数 的 住 什 为 9， 这 意味 着 上 四 分 位 数 为 17 。 


3 3(9， 7 (9 0 ro (7) 30 


下 四 分 位 数 中 位 数 上 四 分 值 数 


3. 四 分 位 距 是 多 少 ? 
四 分 位 骤 等 于 上 四 分 位 数 减 下 四 分 位 数 ， 
四 仿 位 好 = 上 四 分 倍数 一 下 四 分 位 数 
=11-56 
=5 


尼 爹 距 收 多 了 . 


这 个 做 果 除了 异常 值 . 


这 振 国 为 所 


96 ”深入浅出 统计 学 


强大 的 “ 距 ” 


世上 没有 俐 问题 


问 : 
为 什么 需 
人 答 : 平均 玫 仅 能 指出 数据 的 一 个 方面 ， 可 以 据 此 
得 知 数据 的 中 心 ， 人 充 此 而 已 ， 尽 管 很 有 用 ， 但 往往 不 
够 。 除 了 平均 数 ， 还 要 用 其 他 方法 概括 教 据 。 


我 明白 均值 、 中 位 数 、 众 数 都 很 有 用 ， 可 我 
要 知道 数据 的 分 布 情 况 呢 ? 


阅 : 这么 说 ,中 位 数 与 四 分 位 距 是 一 样 的 腾 ? 


答 : 不 对 。 中 位 数 是 数据 的 中 间 值 ， 而 四 分 位 距 
则 是 50% 中 间 数 值 形成 的 一 个 范围 。 


阅 :四 分 位 数 方法 有 何 重要 意义 2? 这 似乎 是 一 种 十 
分 昆 琐 的 计算 范围 的 方法 。 


签 : 使 用 全 距 量 度数 据 分 布 情况 会 存在 一 个 问题 : 
全 距 非常 容易 受 异 常 慎 影响。 全 距 能 让 你 知道 教 据 上 
界 与 于 界 之 间 的 盖 值 ， 但 只 要 反 入 一 个 异常 值 ， 钻 果 
就 会 天 差 地 别 。 

解决 问题 的 办 法 是 : 只 关注 居于 数据 中 央 的 50% 的 数 
据 ， 这 样 做 能 够 排除 异常 值 的 干扰 。 这 意味 着 要 算出 
四 分 位 数 ， 并 用 到 四 分 位 距 。 因 因此， 尽管 求 四 分 位 数 
比 求 上 、 下 界 楷 琐 ， 却 仍 有 无 可 置 絮 的 优点 。 


数据 的 上 、 下 
小 值 。 

全 距 是 量度 数据 分 散 程 度 的 简单 方法 。 计 
算 方法 为 : 

全 距 = 上 界 - 下界 


下 界 即 数据 集中 的 最 大 值 和 最 


全 距 很 容易 受 异常 值 影 响 。 


相 比 全 距 ， 四 分 位 距 较 不 易 受 异常 值 影 响 。 


阅 ;我 总 是 应 该 用 四 分 位 距 重 度数 据 的 分 布 情况 吗 ? 


签 ， 在 大 部 分 情况 下 ， 四 分 位 距 都 比 全 距 更 有 意 
义 ， 但 归根 结 底 取 决 于 你 真正 需要 的 信息 。 还 有 其 
他 一 些 方法 可 以 量度 数据 的 分 布 情况 ， 你 可 能 也 起 
考虑 这 些 方法 ， 我 们 随后 将 会 介绍 这 些 方法 。 


问 : 会 只 想 看 看 某 个 四 分 位 数 ， 而 不 想 看 
全 中 或 四 分 位 距 ? 


答 : 有 有 可能。 例如， 你 可 能 会 有 兴趣 知道 较 大 值 
的 情况 ， 因 此 你 会 只 想 看 看 数据 集 的 上 四 分 之 一 教 
据 ， 这 时 你 将 上 四 分 位 数 作为 分 割 点 。 


培 :我 会 不 会 根 将 数据 分 害 为 比 四 分 之 一 数据 块 更 
小 的 数据 块 ? 假如 把 数据 分 割 为 10 份 ， 而 不 是 4 份 ， 结 
果 如 何 ? 


会 ， 有 时候 你 会 想 这 么 做 。 请 翻 开 下 一 页 ， 


我 们 将 具体 介绍 ………… 





四 分 位 数 即 将 数据 分 割 为 四 等 分 的 几 个 数 
值 。 最 大 的 四 分 位 数 称 为 上 四 分 位 数 ， 最 
小 的 四 分 位 数 称 为 下 四 分 位 数 。 中 间 的 四 
分 位 数 即 中 位 数 。 

四 分 位 距 即 50% 中 间 数 值 形成 的 一 个 间 
距 。 计算 方法 为 : 

上 四 分 位 数 - 下 四 分 位 数 
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OY 宇 PAAd 
将 并 据 分 曹 力 日 分 位 并 


我 们 着 不 局 限于 使 用 四 分 位 数 

前 面 讲 过 如 何 通 过 全 距 和 四 分 位 距 量度 一 批 数据 的 数值 分 散 情 况 ， 
全 距 是 最 大 值 和 最 小 值 之 间 的 差 值 ， 而 四 分 位 距 则 关注 数据 中 间 部 
位 的 50% 数 值 
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那么 我 就 仅 能 用 这 些 上 距 了 
吗 ? 我 有 别 的 选择 吗 ? 









除了 全 距 和 四 分 位 距 ， 还 有 别 的 距 可 供 我 们 使 用 。 

我 们 在 最 初 使 用 全 距 时 磁 到 的 问题 是 : 全 距 极 易 受 异常 值 影响 。 为 了 
解决 这 个 问题 ， 我 们 将 数据 一 分 为 四 ， 然 后 用 四 分 位 距 形成 一 个 经 过 
剪裁 的 数据 距 。 

尽管 四 分 位 距 十 分 常用 ,但 它 并 不 是 构建 迷你 距 的 唯一 方法 。 我 们 
可 以 不 把 数据 分 成 四 份 ， 而 是 分 为 其 他 的 份 数 ， 以 此 形成 我 们 需要 
的 距 。 

例如 ， 假 如 我 们 将 数据 分 成 十 份 ， 而 不 是 四 份 ， 使 得 每 一 个 数据 块 
包含 10% 的 数据 。 于 是 我 们 就 会 得 到 如 下 结果 : 


沪 是 同一 批 数据 ， 但 现在 


分 或 了 相等 的 十 伤 。 每 个 
VT 


我 们 可 以 用 这 些 分 界 形成 一 个 才 新 鬼 述 你 眶 ， 


如 果 你 将 一 批 数据 按 百分比 进行 分 割 ， 则 起 分 割 作 用 的 数值 被 称 为 百 
分 位 数 。 在 上 例 中 ,我 们 的 数据 被 分 成 10 份 ， 因 此 起 分 割 作用 的 数值 
被 称 为 十 分 位 数 。 


我 们 可 以 用 百 分 位 数 构 建 一 个 新 的 距 ， 称 为 百 分 位 距 


强大 的 “ 距 ” 


什么 是 百 分 位 数 ? 


四 分 位 数 是 将 数据 一 分 为 四 的 数值 ， 同 理 ， 百 分 位 数 是 将 数据 一 分 为 百 的 数值 。 每 个 百 分 位 数 
按照 它 所 分 割 出 来 的 数据 的 百分比 进行 命名 ， 因 此 ， 第 十 百 分 位 数 就 是 位 于 数据 范围 10% 处 的 数 
值 。 通 常 ， 第 k 百 分 位 数 就 是 位 于 数据 范围 k% 处 的 数值 ， 常 用 P, 表 示 -。 

k% 


L_ aa 
| 
P、 人 一 PP, 就 是 位 于 数据 范围 Re% 处 的 数值 ， 


四 分 位 数 其 实 也 是 一 种 百 分 位 数 。 下 四 分 位 数 即 P,,, 上 四 分 位 数 即 P,。 
中 位 数 即 P,，。 统计 学 测验 得 分 


百 分 位 数 且 途 中 果 你 得 了 50 分 ， 且 知道 
尽管 百 分 位 距 不 太 常 用 ,但 百 分 位 数 本 身 却 对 于 划分 名 次 、 排 行 很 p = 50， 那 么 你 后 分 数 
有 用 。 你 可 以 通过 百 分 位 数 确定 某 个 数值 相对 于 其 他 数值 的 高 低 。 村 关于 其 他 90 的 人 
例如 ， 假 定 你 听 说 自己 在 统计 学 测验 中 得 了 50 分 ， 仅 看 这 个 数字 本 
身 ， 你 无 法 知道 自己 和 别人 相 比 是 好 还 是 坏 。 可 如 果 有 人 告诉 你 这 
次 测验 的 第 90 百 分 位 数 是 50 分 ， 那么 你 就 知道 ， 你 的 分 数 高 于 或 等 
于 其 他 90% 的 人 的 分 数 。 

求 百 分 位 数 

求 百 分 位 数 的 方法 与 求 四 分 位 数 的 方法 相似 。 

@@ 首先 将 所 有 数值 按 升序 排序 。 





@ 。 为 了 求 出 n 个 数字 的 第 k 百 分 位 数 的 位 置 ， 先 计算 x (3 ) 。 


@@ 。 如 果 结果 为 整数 ， 则 百 分 位 数 处 于 第 x (55) 位 和 下 一 位 数 
之 间 。 取 这 两 个 位 置 上 的 数字 的 平均 值得 出 百 分 位 数 。 





第 尺 百 分 位 数 即 位 于 数 
据 范围 R% 处 网 数 值 ， 
记 为 : 








@ 如 果 k (5) 不 是 整数 ， 则 将 其 向 上 取 整 ， 结 果 即 百 分 位 数 
的 位 置 。 

例如 ， 如 果 你 有 125 个 数 ， 要 求 十 分 位 数 ， 则 先 计算 10 x 125 = 100， 

结果 为 12.5。 将 此 结果 向 上 取 整 ， 得 13， 即 十 分 位 数 为 处 于 第 13 位 

的 数值 。 






Fe 
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箱 线 图 


同 菠 线 固 绘制 各 种 “ 距 ” 


我 们 已 经 滔滔 不 绝地 讲 过 各 种 距 ， 如 果 能 用 直观 的 方法 比较 不 同 
数据 集 的 距 ， 将 会 大 有 神 益 。 有 一 种 图 形 专门 用 来 显示 各 种 各 样 
的 距 ， 这 就 是 箱 线 图 ， 或 者 简称 箱 形 图 。 


箱 线 图 显示 数据 的 全 距 、 四 分 位 距 以 及 中 位 数 。 在 同一 张 箱 线 图 上 
可 以 比较 几 批 数据 ， 也 就 是 说 ， 箱 线 图 是 对 不 同 数据 集 进行 比较 的 
极 好 方法 。 

为 了 创建 一 幅 箱 线 图 ， 你 首先 要 按照 标 度 画 出 一 个 “ 箱 ”， 箱 的 左 
右 两 边 分 别 代 表 下 四 分 位 数 和 上 四 分 位 数 ; 然后 ， 在 箱 中 画 一 条 
线 ， 标 示 出 中 位 数 ; 通过 这 个 箱 你 能 看 出 四 分 位 距 的 宽度 。 随 后 ， 
在 箱 的 两 边 画 出 “ 线 ”， 显 示 出 全 距 的 上 界 、 下 界 以 及 宽度 。 以 下 
是 95 页 提 到 的 球员 得 分 的 箱 线 图 。 

篮球 球员 得 分 


一 一 一 一 全 第 一 一 > 


四 分 位 距 





33677 10 10 10 11 13 30 





0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 
得 分 







如 果 你 的 数据 中 有 异常 值 ， 则 全 距 会 更 宽 。 在 箱 线 图 上 , 一 
条 条 线 的 长 度 会 随 着 上 、 下 界 的 增长 而 增长 。 通 过 观察 箱 
线 图 上 的 线 ， 就 能 了 解数 据 的 偏 斜 程度 。 


如 果 箱 线 图 是 对 称 的 ， 表 示 基 础 数据 很 可 能 也 相当 对 称 。 





这 么 说 箱 线 图 还 真是 一 
种 显示 各 种 “上 距 ” 和 四 
分 位 数 的 简明 办 法 . 
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强大 的 “ 距 ” 


下 面 是 另 两 位 球员 的 箱 线 图 。 比 较 他 们 得 分 的 距 。 如 果 你 必须 选择 让 球员 A 或 球员 B 留 在 队 
错 习 里 ， 你 会 选 哪 一 位 ? 为 什么 ? 
球 凑 A 和 球员 B 和 全 分 


8 10 12 14 16 18 20 22 24 26 28 30 


得 分 





外 
世上 没有 傻 问题 
培 : 我 确信 我 曾 见 过 和 这 里 的 箱 线 图 外 观 有 所 差别 的 ” 赔 | : ”那么 ， 如 果 把 均值 表示 成 点 ， 它 会 出 现在 中 位 数 
箱 线 图 。 的 左边 还 是 右边 ? 


签 : 箱 线 图 确实 有 很 多 种 形式 。 有 一 些 形式 刻意 把 ”入 : ; 如 果 孝 据 向 右 偏锋 ， 则 均值 将 位 于 中 位 数 的 右 
线 画 短 ， 并 明确 地 用 点 或 星 号 表示 异常 值 ， 这 样 就 很 窜 边 ， 右 边 的 线 将 比 左 边 的 线 更 长 ; 如 果 数 据 向 左 偏 针 ， 
易 看 出 有 多 少 异 常 值 ， 以 及 异常 值 到 底 有 多 极端 。 另 一 ” 则 均值 将 位 于 中 位 教 的 左边 ,走边 的 线 将 比 右边 的 线 
些 形式 则 把 均值 表示 为 点 ， 这 样 你 就 能 看 出 均值 相对 于 更 长 ， 
中 位 教 的 位 置 。 在 学 习 统计 课程 的 时 候 ， 查 清楚 有 可 能 
用 到 的 藉 线 图 形式 是 个 不 错 的 主意 。 
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下 面 是 另 两 位 球员 的 箱 线 图 。 比 较 他 们 得 分 的 距 。 如 果 你 必须 选择 让 球员 A 或 球员 B 留 在 队 
里 ， 你 会 选 哪 一 位 ? 为 什么 ? 


球员 A 和 球员 8 得 分 


alls 


4 6 8 10 12 14 16 18 20 22 24 26 28 30 


得 分 
建 员 入 由 全 好 相对 义 小 ， 他 歇 得 分 中 位 数 比 球员 色 高 一 些 . 
球员 和 的 全 缚 非常 大 ， 有 有 时候 这 位 妹 员 的 得 分 比 球员 A 高 很 和 多， 人 坦 
有 时 又 低 很 多 
球员 A 发 挥 更 稳定 ， 通 常 得 今 高 于 球员 己 〈 请 比 著 中 位 数 和 四 今 们 
虐 ) ， 所 以 ， 我 们 会 选择 球员 A， 


百 分 位 数 将 数据 一 分 为 百 。 对 于 划分 档次 ”me” 精 线 图 ( 或 称 箱 形 图 ) 能 在 同一 张 图 上 体 
非常 有 用 。 现 多 个 距 和 四 分 位 数 ， 是 在 这 方面 十 分 有 


第 k 百 分 位 数 就 是 位 于 数据 范围 k% 处 的 数 。 用 的 种 方 法 。 _ 逢 ”显示 出 四 分 位 数 和 
人 四 分 位 距 的 位 置 ，“ 线 ” 则 显示 出 上 、 下 


百 分 位 距 与 四 分 位 距 相似 ， 但 百 分 位 距 是 和 
介 于 两 个 百 分 位 数 之 间 的 距离 。 ” 
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看 来 四 分 位 上 距 很 有 用 . 未 过 ， 要 是 碰 上 时 
不 时 得 分 起 烛 的 球员 怎么 办 ? 假 册 某 一 位 球 
员 在 比赛 那天 乱 来 ， 我 们 的 联赛 就 完了 ! 未 管 
是 爹 眶 还 是 四 分 位 虐 ， 我 都 未 他 确信 它 能 帮 
我 选 出 真正 最 稳定 的 球员 . 





教练 不 仅 需 要 比较 球员 得 分 的 全 距 ， 他 还 需要 以 某 种 更 为 
精确 的 方法 量度 大 部 分 数值 的 位 置 所 在 ， 借 此 判定 哪 一 位 
球员 真正 值得 信赖 ， 值 得 在 比赛 日 委 以 重任 。 也 就 是 说 ， 
他 需要 找到 得 分 起 伏 最 小 的 球员 。 

全 距 与 四 分 位 距 的 问题 是 : 它们 仅 告诉 你 最 大 值 和 最 小 值 
之 间 的 差 值 ， 却 无 法 告诉 你 球员 们 得 到 这 些 最 高 分 或 最 低 
分 的 频率 ， 以 及 球员 们 得 到 更 接近 数据 中 心 的 得 分 的 频 
率 一 而 这 却 对 教练 很 重要 


教练 需要 一 支 值得 信赖 的 球员 队伍 ， 他 最 不 想 要 的 就 是 表 
现时 好 时 坏 ， 水 平反 复 无 常 的 队员 。 


为 了 帮助 教练 作出 决定 ， 我 们 能 做 点 什么 呢 ? 


我 们 该 如 何 更 精确 地 量度 变异 性 ? 


第 3 章 ”分 散 性 与 变异 性 的 量度 。 103 


探讨 变异 性 


变异 性 比分 散 性 更 具体 


我 们 希望 量度 每 批 得 分 的 分 散 性 ,不 止 如 此 ， 还 希望 找到 某 种 
方法 ， 利 用 所 得 到 的 分 散 性 看 出 球员 的 稳定 程度 ， 也 可 以 这 样 
说 : 我 们 希望 能 够 量度 球员 得 分 的 “变异 性 ”。 


实现 以 上 目的 的 一 个 方法 是 : 观察 每 个 数值 与 均值 的 距离 。 
如 果 我 们 能 够 算出 各 个 数值 与 均值 的 某 种 平均 距离 ， 就 有 办 法 
量度 变异 性 和 分 散 性 。 结 果 越 小 ， 数 值 与 均值 的 距离 越 近 。 下 
面 让 我 们 看 一 看 。 

球员 1 的 篮球 赛 得 分 





这 张 图 上 的 各 个 数值 与 均值 相距 甚 远 。 如 果 教 练 把 
这 位 球员 选 进 球 队 ， 他 就 不 太 可 能 预测 出 球员 在 比 
赛 日 的 表现 。 如 果 这 位 球员 在 比赛 日 那天 很 顺 ， 他 
或 许 能 得 极 高 的 分 ; 若 那天 很 误 ， 他 或 许 根本 无 法 
得 高 分 ， 也 就 是 说 ， 球 队 很 可 能 因 他 而 败北 


这 是 另 一 位 球员 的 得 分 数值 ， 与 均值 的 距离 近 得 
多 ， 变 化 也 更 少 。 如 果 教 练 把 这 位 球员 选 进 球 队 ， 
他 会 非常 清楚 该 球员 在 每 场 比赛 中 可 能 的 表现 





这 是 说 我 们 只 要 算出 


数值 与 均值 的 平均 距离 就 
行 了 ? 





让 我 们 找 找 答案 。 
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计算 平均 距离 


假想 你 有 三 个 数字 : 1、2、9, 均值 为 4。 如 果 我 们 求 
出 这 几 个 数值 与 均值 的 平均 上 距离， 结果 如 何 ? 


平均 距离 = 
3 


3+2+(-5) 


=0 


(1 至 pj)+ (2 至 pj}+(9 至 凡 ) 


re 


各 个 数值 与 均值 的 平均 距离 总 是 为 0 一 正 负 距 离 相 互 


抵消 。 耶 么 ,我 们 现在 该 怎么 办 ? 


阅 : 等 式 中 为 什么 会 出 现 - 5? 我 
会 以 为 距离 是 5。 距 离 怎么 是 负数 呢 ? 


答 ; 由 于 旦 小 于 9， 因 此 9 至 上 
的 距离 为 负数 ; 1 和 2 都 小 于 jy ， 双 
此 距离 均 为 正 数 。 这 正 是 各 个 距离 
相互 抵消 的 原因 。 


网 ;我们 不 能 只 取 正 距 离 计 算 平 
均 距离 吗 ? 


签 : 这 似乎 很 直观 ， 但 在 实际 
应 用 中 ， 统 计 师 很 少 这 样 做 ， 还 有 
另 一 种 方法 能 确保 各 个 距离 不 相互 
抵消 ,我们 很 决 就 会 讲 到 。 这 种 方 
法 能 确定 典型 值 与 均值 的 距离 迁 近 ， 
在 统计 学 中 广泛 使 用 ， 在 本 书后 文 
中 的 大 部 分 章节 都 会 出 现 。 


世上 没有 傻 问 题 


| 问 :肯定 不 是 所 有 数值 的 距离 都 会 
相互 抵消 ， 我 们 可 能 只 是 不 走运 而 已 。 


等 : 无 论 你 选择 哪些 数值 ， 这 
些 数值 与 其 均值 的 各 个 距离 总 是 相 
互 狐 消 。 下 面 考 考 你 : 取 一 批 教 ， 
算出 均值 算出 每 个 数值 与 均值 的 
距离 ， 然 后 将 这 些 距离 相 加 。 结 果 
次 次 都 是 0， 


阅 : 不 能 用 四 分 位 距 判 断 得 分 是 
否 稳定 吗 ? 


签 ; 四 分 位 距 仅 仅 用 了 一 部 分 
数据 来 量度 分 散 性 。 如 果 一 位 球员 
有 一 场 比赛 得 分 不 佳 ， 这 场 得 分 将 
会 被 别 除 掉 。 为 了 实事 求 是 地 确定 
可 靠 性 和 稳定 性 ， 我 们 需要 考虑 所 
有 得 分 。 


强大 的 “ 距 ” 





| 间 : ”全 距 用 上 了 全 部 得 分 。 为 什 
么 不 能 用 全 距 呢 ? 


答 ;全 距 仅 仅 在 描述 最 大 值 和 
最 小 值 之 间 的 差 值 时 才 确 实 表现 不 
错 。 如 前 所 述 ， 全 距 并 不 能 体现 数 
值 的 实际 分 布 形态 。 我 们 需要 用 男 
一 种 方法 进行 量度 。 


各 个 数值 与 艾 值 的 距 
离 正 、 负 相抵 。 
ee 
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用 方差 和 标准 差 量度 差异 性 


我 们 可 以 用 方差 计算 变异 性 …… 
我 们 要 想 出 一 个 办 法 量度 各 个 数值 与 均值 的 平均 距离 ， 这 个 办 
法 要 能 防止 距离 与 距离 之 间 相互 抵消 。 












我 们 需要 想 个 办 法 把 所 有 的 数字 
都 变 为 正 数 ， 也 许 先 弄 出 各 个 距离 
的 平方 数 能 行 ， 这样 一 来 ,每 个 数 
字 就 都 变 为 正 数 了 . 


让 我 们 试 着 用 原来 的 三 个 数字 算 一 下 。 ni 并 


2 (1 至 + (2 至 pg)?+ (9 至 
平均 (距离 ) 


34 二 人 (5) 


这 一 次 龙 
和 区 ”下 数 相 如。 
9+4+25 


3 
= 12.67 (保留 两 位 小 数 ) 


重要 统计 量 


| 方 郑 











这 一 次 ,各 个 距离 没有 相互 抵消 ， 我 们 得 到 了 一 个 有 意义 的 
数 。 由 于 我 们 使 用 了 各 个 数值 与 均值 的 距离 的 平方 数 ， 所 有 






的 加 数 都 为 非 负 数 ， 把 这 些 数字 加 起 来 ， 结 果 为 非 负数 一 
次 次 如 此 。 

方差 是 量度 数据 分 散 性 的 一 
这 种 量度 数据 分 散 情况 的 方法 称 为 方差 ， 是 一 种 非常 常用 的 种 方法 ， 是 数值 与 均值 的 距 
描述 数据 分 散 性 的 方法 。 下 面 是 以 上 等 式 的 通用 形式 : 高 的 平方 数 的 平均 值 . 


方差 是 数值 与 均 


Rk 
数 的 平均 值 。 
之 (x - b)- 


Sr 
n 





方差 = 
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强大 的 “ 虐 ” 


但 标准 项 放 是 更 直观 的 量度 方法 


统计 师 大 量 使 用 方差 量度 数据 的 分 散 倩 况 。 方 差 很 有 用 ， 这 是 因 
为 它 用 到 了 每 一 个 数据 ， 据 此 得 出 结果 。 可 以 认为 方差 是 数值 与 
均值 的 距离 的 平方 数 的 平均 值 。 


可 我 为 什么 要 考 虚 诽 南 的 平方 呢 ? 


这 黄 系 上 直观 ， 有 别 揭 办 法 吗 ? 





我 们 真正 想 要 的 是 这 样 一 个 数 : 能 根据 与 均值 的 距离 一 而 不 是 距离 
的 平方 指出 分 散 性 。 


方差 的 问题 是 ， 人 人 们 恶 怕 难 以 根据 距离 的 平方 数 去 考虑 分 散 性 。 
有 一 个 简单 的 办 法 可 对 此 进行 修正 一 取 方 差 的 平方 根 ， 我 们 将 此 结果 





称 为 标准 差 。 
让 我 们 算出 前 面 提 到 的 数据 集 的 标准 差 。 方 差 为 12.67， 即 ; 
标准 差 = V12.67 
= 3.56 (保留 两 位 小 数 ) 


也 就 是 说 ， 典 型 值 与 均值 的 距离 是 3.56。 


标准 人 莽 技 术 要 话 


我 们 已 经 看 出 ， 标 准 差 是 描述 典型 值 与 均值 距离 的 一 种 方法 ， 标 准 
差 越 小 ， 数 值 离 均 值 越 近 。 标 准 差 可 能 得 到 的 最 小 数值 为 0。 


像 均 值 一 样 ， 标 准 差 也 有 自己 的 专用 符号 c ， 即 希腊 字符 “西格玛 ” 
的 小 写 ( 大写“ 西格玛 ”在 第 二 章 出 现 过 :  ， 表 示 求 和 ) 。 


为 了 求 出 ， 先 计算 方差 。 然后 取 其 平方 根 。 


o = 方差 
i O 


2 凤 
cz= 方差 第 3 章 “分 散人 性 与 变异 性 的 量度 









我 是 标准 共 ， 要 是 你 想 
量 关 与 均值 的 虐 离 ， 请 
给 我 未 个 电话 。 







107 


108 


标准 差 访 谈 


本 周 话题 : 
量度 标准 差 


Head First: 嗨 ， 标 准 差 ， 见 到 你 太 好 了 。 
标准 差 : 很 高 兴 见 到 你 ，Head First。 


Head First: 首先 ， 我 想 你 能 不 能 多 给 我 们 谈 谈 你 自 
己 和 你 的 工作 。 


标准 差 : 我 无 非 就 是 量度 数据 的 分 散 性 。 均 值 很 擅长 
让 别人 知道 数据 中 心 的 情况 ， 但 这 往往 不 够 。 有 时 候 
均值 需要 有 人 帮忙 给 出 更 完整 的 情况 ， 我 就 是 为 此 而 
来 。 均 值 体现 了 平均 数 ， 而 我 体现 了 数值 的 变异 度 。 


Head First: 总 我 冒昧 ， 我 干 路 要 管 数据 变异 ? 这 很 
重要 吗 ? 我 肯定 ， 只 要 知道 一 批 数据 的 平均 数 就 够 
了 。 


标准 差 : 我 来 举 个 例子 吧 。 话 说 你 从 本 地 餐厅 定 了 
一 份 快餐 ， 当 东西 送 到 时 ， 你 发 现 食物 一 半 烧 焦 ， 
一 半 全 生 ， 这 时 你 感受 如 何 ? 

Head First: 我 可 能 会 觉得 不 开心 ， 觉 得 猴 ， 还 打算 
告 那 家 和 餐厅。 怎么 了 ? 

标准 差 : 可 是 ， 从 均值 看 来 ， 你 的 食物 是 以 最 合适 
的 温度 毫 饪 的 一 均值 显然 没有 体现 事情 的 全 部 真 
相 。 你 真正 需要 知道 的 是 变异 ， 我 就 是 为 此 而 来 。 
我 会 根据 均值 体现 的 典型 值 ， 指 出 你 该 期 望 各 个 数 
值 相对 于 这 个 典型 值 如 何 变化 。 


Head First: 我 想 我 明白 了 。 均 值 给 出 了 平均 数 ， 而 
你 给 出 了 分 散 程度 。 可 你 是 怎么 办 到 的 呢 ? 


标准 差 : 这 很 简单 。 我 不 过 是 指出 数据 与 均值 的 


深入 浅 出 统计 学 


距离 一 平均 而 言 。 假 定 有 一 批 数 据 的 标准 差 为 
3cm， 你 可 以 当 作 这 是 在 说 : 平均 而 言 ， 这 些 数 值 
与 均值 的 距离 是 3cm。 其 实 标准 差 不 止 包含 这 些 信 
息 ， 不 过 ， 只 要 顺 着 这 样 的 思路 去 思考 ， 你 就 找 对 
方向 了 。 


Head First: 说 到 你 的 数字 ， 标 准 差 ， 你 是 大 一 点 好 
还 是 小 一 点 好 ? 


标准 差 : 哦 ， 这 完全 取决 于 你 要 用 我 做 什么 。 如 果 
你 正在 生产 机 器 零件 ， 你 会 希望 我 小 一 点 ， 这 样 才 
能 确保 所 有 的 零件 都 一 致 ， 如 果 你 正在 研究 一 家 大 
公司 的 工资 ,那么 我 自然 会 比较 大 。 

Head First: 我 明白 了 。 告 诉 我 ， 你 和 方差 有 什么 关 
系 吗 ? 

标准 差 : 问 得 真 好 笑 。 方 差 就 是 另 一 个 我 一 把 我 
平方 一 下 ， 我 就 变 成 方差 ; 取 方 差 的 平方 根 ， 我 就 
又 回来 了 。 我 们 两 个 就 像 是 克拉 克 和 超人 ， 只 是 少 
件 披风 而 已 。 


Head First: 再 问 一 个 问题 ， 你 有 没有 在 均值 身边 自 
刁 形 秽 的 时 候 ? 毕 竟 他 受到 的 关注 比 你 多 多 了 。 


标准 差 : 当然 没有 。 我 们 是 铁 哥 儿 们 ， 我 们 相互 扶 
持 。 青 说 ,要 是 自居 形 秽 的 话 ， 会 让 我 显得 很 负 
面 一 我 可 从 来 不 会 是 负 的 。 

Head First: 标准 差 .感谢 你 的 参与 。 


标准 差 : 我 很 乐意 。 


强大 的 “ 距 ” 


加 现在 该 你 来 显示 一 下 标准 差 的 实力 了 。 请 计算 下 列 数字 的 均值 和 标准 差 。 


绒 习 


123456 7 
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练习 解答 


现在 该 你 来 显示 一 下 标准 差 的 实力 了 。 请 计算 下 列 数字 的 均值 和 标准 差 。 


习 
角 
1234567 方案 
让 我 们 先 算 场 人 7 
1 二 2+3 二 4 十 5 二 6 十 7 二 二 二 


相生 “六 seam 
7 7 


174) + (2-4)? + (3-4): + (4-4)? + (5-4)* + (6-4)* + (7-4)* 





9+4+T 十 0 十 1 十 4 十 9 


28 
7 
4 


py (1-3.5)2 + (2-3.5)2 + (3~3.5)* + (4-3.5)2 + (5-3,5): + (6-3.5)* 
12345 6 6 


1 十 2 十 3 十 4 十 5 十 6 2.5 十 15 + 0.5* + (-0.5)* + (~1.5)? 二 【2.5 和 
本 6 
6.25 + 2.25 二 + 0.25 + 0.25 十 2.25 + 6.25 
所 


= 2.92 {保留 网 位 小 : 数 ) og 一 V2.92 
= 1.71 (保留 两 们 小数) 


这 此 算法 但 揽 素 。 有 没有 容易 
点 的 办 法 ? 





标准 差 的 计算 可 能 很 快 就 会 变 得 错综复杂 。 

为 了 求 出 标准 差 ， 必须 先 算出 方差 ， 即 求 出 每 一 
个 x 的 (x- bY。 不过， 还 有 一 个 更 简单 但 作用 相同 
的 方差 计算 公式 ， 请 看 下 一 页 的 内 容 。 不 过 , 在 
此 之 前 ， 请 你 先 将 推导 算式 从 奇妙 池 里 迭出 来 。 
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强大 的 “ 距 ” 


妾 妙 池 


这 里 藏 着 一 个 较 简单 的 计算 方差 的 方法 ， 它 的 
真面目 如 何 ? 你 的 任务 是 将 一 些 方 程式 
碎片 从 奇妙 池 里 捞 出 来 ， 将 它们 放 入 推 En wu 
导 过 程 中 的 空白 位 置 。 每 个 碎片 只 能 用 

一 次 ， 但 不 需要 把 所 有 碎片 都 用 上 。 目 

标 : 得 出 最 后 的 方程 式 。 











Ex-H)” _ Zx-H)(x-hH) 
n n 
2 +H) 
n 
看 看 你 能 未 
能 从 这 几 .…. 2 DUZER 
A 1 n n 
到 这 这 几 ， 
区 
i 
se n 
_ 
二 一 一 -~ H2 
n 


注意 : 池 中 的 每 个 算式 
只 能 用 一 次 ! 
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竺 妙 池 解 管 


这 里 藏 着 一 个 较 简单 的 计算 方差 的 方法 ， 它 的 
真面目 如 何 ? 你 的 任务 是 将 一 些 方程 式 
碎片 从 奇妙 池 里 捞 出 来 ， 将 它们 放 入 推 
导 过 程 中 的 空白 位 置 。 每 个 碎片 只 能 用 
一 次 ， 但 不 需要 把 所 有 碎片 都 用 上 。 目 
标 : 得 出 最 后 的 方程 式 。 





hs 
n n 





n 
. 
es n n J 有 ， 
2 
= 
n 






这 小 碑 片 用 未 着 . 


> 
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方 基 速 筑 法 

如 前 所 述 ， 标 准 差 是 量度 分 散 性 的 一 种 方法 ,但 为 了 计算 标准 
差 而 进行 的 方差 计算 会 迅速 变 得 错综复杂 一 难 就 难 在 要 计算 
每 一 个 x 的 (x- 上 )。 所 处 理 的 数据 越 多 ， 就 越 容易 出 错 ， 当 此 
是 一 个 数位 众多 的 小 数 时 尤其 如 此 。 下 面 是 一 个 能 较 快 算出 方 
差 的 方法 : 


方差 = 一 - 玉 


以 上 方法 的 优点 是 不 必 计 算 (x- 7。 在 实践 中 的 意义 是 ， 处 
理 起 来 不 太 麻 烦 ， 犯 错误 的 几率 也 更 小 。 


| 
世上 没有 俐 问题 
网 :那么 我 该 用 哪 种 形式 的 方差 间 
计算 式 呢 ? i 


管 ， 说 到 计算 ， 第 二 种 形式 曙 常 人知 。 可 以 。 标准 是 是 方 总 的 入 
用 ， 印 ， 根 ， 也 就 是 说 ,方差 是 标准 差 的 平 
2 . 方 。 如 要 通过 标准 差 求 方差 ， 只 要 


出 标 ; 印 百 
在 处 理 小 数位 数 众 多 的 均值 时 ， 这 本 准 基 的 平方 数 即 可 


种 算法 尤其 重要 。 


问 : 


标准 差 ? 


答 : 和 以 前 一 模 一 样 ， 取 方差 的 
平方 报 即 可 得 标准 差 。 


闭 ; 我 发 现 标准 差 确实 很 费 脑子 。 
再 问 一 遍 ， 它 是 什么 来 着 ? 


每 : 标准 盖 是 量度 分 散 性 的 一 
种 方法 ， 它 楼 述 了 典型 什 与 均值 的 
距离 。 


如 果 标 准 差 较 大 ， 意 味 着 教 值 往往 距 
离 均值 较 远 ; 如 果 标 准 差 较 小 ， 则 数 
值 往往 距离 均值 较 近 。 


我 如 何 用 这 个 方差 算式 计算 
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强大 的 “ 距 ” 


重 受 统 计 旺 


方 昨 


下 面 是 一 个 能 装 快 算出 方 
全 的 方法 : 
1 
ZX _ 
nm 上 













培 :标准 差 会 是 0 吗 ? 


准 差 为 0。 换 名 话说， 如 果 每 个 数值 与 
均值 的 距离 都 是 0， 则 标准 差 将 为 0。 


| 问 :标准 差 的 计量 单位 是 什么 ? 


会 。 当 所 有 数值 都 相同 时 ， 标 


签 标准 差 的 计量 单位 与 相应 数 
据 的 单位 相同 。 若 以 “ 屋 米 。 进行 
计量， 当 标 准 盖 为 1 时 ， 即 表示 在 典 
型 情况 下 ， 数 值 与 均值 相距 1 厘米 。 


阅 ;我 肯定 在 你 的 方差 计算 公式 


中 看 到 过 除数 是 (Cn -1) ,而 不 是 nn， 
是 不 是 哪里 错 了 ? 
咎 : 倒是 没 错 ， 不 过 这 种 形式 的 


方差 仅 在 处 理 祥 本 时 使 用 ， 本 书后 
广 谈 及 抽样 时 将 详 加 说 明 。 
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化 身 教练 


化 身 教 舌 


锭 时 有 三 位 球员 的 得 分 ， 雹 值 者 





是 10。 你 的 任务 就 是 化身 为 | 得 分 |7 |9 lo 
教 狂 ， 复 出 每 位 妹 员 的 标准 [11 | 


天。 针 找 哪 一 位 球员 是 球 队 
臣 萌 得 住 的 仗 伴 ? 


球 R2 | 分 | | |9 II 1 2 3 
频数 li 1 2 | | Th 


球 R3 | 分 |3 |6 7 II mm II | 
毁 数 |2? ll| | | 1 hh TD 
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强大 的 “ 距 ” 


加 娃 巴 仕 咖啡 连锁 店 惊 镁 大 方 的 首席 执行 官 想 给 全 体 员 工 加 薪 。 他 拿 不 定 主意 : 是 直接 给 每 个 
狼 习 人 加 2,000 美 元 呢 ， 还 是 按 10% 的 比例 加 。 


a) 如 果 星 巴 仕 每 位 职员 都 加 和 薪 2,000 美 元 ， 标 准 差 会 发 生 什 么 变化 ? 


b) 如 果 星 巴 仕 人 每 位 职员 都 加 薪 103 ， 标 准 差 会 发 生 什么 变化 ? 
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化 身 教 练 解 答 


化 身 孝 锋 


外 时 有 三 位 球员 的 得 分 ,均值 都 。 际 员 
10 。 
是 10。 你 的 任务 就 是 化 身 为 





雳 。 导 式 哪 一 位 球员 是 球 队 


10 


频数 |1 | 
72 十 8 十 2{f92) 十 20109 + 2(117) + 122+ 137 
帮 关 “= 一 -一 一 一 一 -10 


10 


49 十 654 十 162 十 200 十 242 二 144 十 169 
一 -100 


10 
一 3 


标准 故 =VY3 = 1.73 


球员 3 | 得 人 |3 |e | lo II 3 la 
尊 数 | | | | 1 TH 1 
2{37) 十 6 十 2(73) 十 3(102) 十 了 1z 十 了 132 十 307 


方 卷 ”= 一 -100 
11 


18 + 36 二 998 十 300 十 121 十 169 十 900 
C00 


11 
= 49.27 


标准 考 二 好 9.27 一 7.02 


he | 一 


49 十 162 十 400 十 242 士 169 


划 永 得 住 的 伙伴 ? 本 生 :所 7z 十 2f(9 切 十 对 (905 十 21T73) 十 了 了 
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妹 员 1 和 妹 员 2 的 标准 全都 很 小 ， 说 明 数 值 卫 集 在 场 值 周 图 ， 面 妹 员 3 购 标准 着 
为 7.02， 即 在 葛 型 情况 下 ， 得 分 与 均 镇 的 虐 离 为 7.02。 办 比 ， 球 员 1 是 最 和 犯 完 


曲 ， 妹 员 3 最 不 稳 完 。 
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习 人 加 2,000 美 元 呢 ， 还 是 按 10% 的 比例 加 。 


解答 


a8) 如 果 星 巴 仕 每 位 职员 都 加 薪 2,000 美 元 ， 标 准 差 会 发 生 什么 变化 ? 


标准 差 完全 示 蛮 。 实际 上 ， 数 字 都 独 盾 商 并 向 一 侧 匠 动 ， 因 此 标准 琶 不 廊 。 


F(x + 2000) - (aa 十 2000) 六 

标准 是 一 中- 一 
| $+ 2000- bh -2000) ' 
Yn 


Zi-h) 


以 


原来 的 标准 倒 





b) 如 果 旺 巴 仁 每 位 职员 都 加 薪 1039 ， 标 准 差 会 发 生 什 么 变化 ? 


标准 是 放大 170%， 本 1.1 倍 。 数 窜 竹 接 沉 了 ， 轩 此 标准 莽 增 大 了 .， 


(Go - (11 1)) 

标准 其 = 一 一 一 一 一 一 
D> 1.1 K-pn) 
[Exk-p) 
= Wh i 


二 1.1 舍 原 未 拘 标 准 枉 


强大 的 “ 距 ” 


星 巴 仕 咖啡 连锁 店 娘 慨 大 方 的 首席 执行 官 想 给 全 体 员工 加 和 薪 。 他 拿 不 定 主意 : 是 直接 给 每 个 
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标准 得 分 


碰 上 需要 比 绞 基准 的 情况 该 怎么 办 ? 

我 们 已 经 讲 过 如 何 使 用 标准 差 量度 一 批 数据 的 变异 情况 ， 也 已 经 用 标准 差 为 
统计 邦 全 明星 篮球 队 挑 出 了 得 分 最 稳定 的 球员 ,但 标准 差 的 用 途 不 止 于 此 。 
假想 有 两 位 能 力 不 同 的 篮球 队员 : 第 一 位 投篮 命中 率 为 70%， 其 标准 差 为 少儿 
20%; 第 二 位 投 复命 中 率 为 40%， 标 准 差 为 10%。 
在 某 一 次 训练 中 ， 球 员 1 投 篮 命中 率 是 75%， 球 员 2 投篮 命中 率 为 55%。 从 球 

员 本 人 的 历史 记录 看 来 ， 哪 一 位 球员 的 表现 更 好 ? 














这 简单 一 球员 1 更 好 鹃 。 
球员 1 投篮 得 分 的 比例 是 75%， 
球员 2 投篮 得 分 的 比例 才 55%. 


只 看 百分数 无 法 了 解 全 部 真相 。 

75% 听 起 来 是 个 很 高 的 百分数 ， 但 我 们 并 不 是 在 研究 每 一 位 球员 的 均值 和 
标准 差 。 每 一 位 球员 的 得 分 情况 都 高 于 自己 的 均值 ， 但 相 比 球员 本 人 的 历 
史记 录 ， 哪 一 位 发 挥 得 更 好 呢 ? 我 们 该 如 何 对 这 两 位 球员 进行 比较 ? 


这 两 位 球员 的 均值 和 标 
准 肥 不 一 榜 ， 我 们 访 央 何 


ES 
i Vy il 


b=70 
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og =20 百分数 o=10 百分数 


这 样 的 比较 是 否 有 可 能 实现 ? 别 担心 ， 我们 可 以 使 用 标准 分 (或 者 叫 Z 
分 ) 实 现 这 个 目的 。 
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强大 的 “ 距 ” 


使 用 标准 分 比较 不 同 数 据 集 中 的 数值 


使 用 标准 分 可 以 对 不 同 数 据 集 的 数据 进行 比较 ， 而 这 些 不 同 数据 集 的 均值 各 
标准 差 各 不 相同 一 标准 分 是 对 不 同 环境 下 的 相关 数据 进行 比较 的 一 种 方法 。 
例如 ， 你 可 以 使 用 标准 分 比较 球员 相对 于 其 本 人 历史 记录 的 表现 ， 这 有 点 上 儿 
像 私人 教练 的 一 贯 做 法 。 

通过 整个 数据 集 的 均值 和 标准 差 可 求 出 一 个 特定 数值 的 标准 分 。 标 准 分 通常 
以 字母 “z” 表 示 ， 为 了 求 出 特定 数值 x 的 标准 分 ， 可 用 下 式 进行 计算 : 


文中 数值 x 所 在 拘 数 据 
XK- 有 和 各 汉 均值、 标准 基 ， 


= 
Oo 
让 我 们 算出 每 位 球员 的 标准 分 ， 看 看 它 能 向 我 们 透露 什么 信息 。 
计算 标准 分 


让 我 们 先 算 z ， 即 球员 1 的 标准 分 。 


75 -70 





Z, 三 
20 


= 0.25 
如 上 ， 透 过 用 均值 和 标准 差 对 得 分 进行 标准 化 ， 球 员 1 的 得 分 为 
0.25。 球 员 2 的 得 分 如 何 呢 ? 


55 - 40 
2z， 三 





10 


= 1.5 


算得 球员 2 的 标准 分 为 1.5， 而 球员 1 的 标准 分 为 025。 这 究竟 有 何 意义 ? 
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标准 分 释义 


标准 分 称 义 


标准 分 为 我 们 提供 了 一 种 对 不 同 数据 集 的 数据 进行 比较 的 办 法 ， 这 些 不 同 数据 集 的 均 
值 和 标准 差 甚 至 都 各 不 一 样 。 通 过 这 种 方法 ,我们 可 以 把 这 些 数值 视 为 来 自 同一 个 数 
据 集 或 数据 分 布 ， 从 而 进行 比较 。 


而 这 对 于 我 们 上 面 提 到 的 两 位 篮球 队员 有 何 意义 呢 ? 


每 一 位 球员 的 投篮 命中 率 都 有 不 同 的 均值 和 标准 差 ， 若 要 比较 球员 们 相对 于 自己 的 历 
史记 录 的 表现 情况 ， 这 就 带 来 了 困难 。 我 们 可 以 看 出 ， 在 一 次 特定 训练 中 ， 一 位 球员 
的 投篮 命中 率 高 于 另 一 位 球员 ， 我 们 还 注意 到 ， 这 两 位 球员 的 投篮 命中 率 都 比 自己 的 
平均 成 绩 更 高 。 难 点 在 于 要 比较 两 位 球员 相对 于 他 们 本 人 的 历史 记录 的 表现 。 


标准 分 将 每 一 个 数据 集 转 化 为 更 为 通用 的 分 布 形 态 ， 从 而 有 可 能 进行 上 述 比较 。 我 们 
可 以 求 出 每 位 球员 在 训练 中 的 标准 分 ， 进 行 转化 ， 然 后 进行 比较 。 











p=70 
球员 1 /~ 75 
~” > 
本 : : ~ 
oc=20 一 、 
-全 ~ 
NN 但 我 们 可 以 通过 ee 
很 难 丰 接 对 这 两 个 z 分 进行 比 融 ， 
数据 集 进 行 比 教 。 ~ 
h = 40 
球员 2 2 “55 ee 
> 达能 让 我 们 知 放 球员 的 什么 信息 ? 
og 球员 1 的 标准 分 是 0.25， 而 球员 2 的 标准 分 是 1.5。 换 句 话说 ， 
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在 将 得 分 标准 化 以 后 ,球员 2 的 得 分 比 球员 1 的 得 分 更 高 。 


这 意味 着 ， 尽 管 从 总 体 上 看 球员 1 是 一 位 更 优秀 的 投篮 手 ， 
投篮 命中 率 比 球员 2 更 高 ,但 相对 于 本 人 的 历史 记录 ， 却 
是 球员 2 表现 更 好 。 球 员 2 表 现 更 好 指 的 是 …… 和 自己 比 。 


深入 浅 出 统计 学 


强大 的 “ 距 ” 












半 准 分 织 织 著 
标准 分 的 作用 是 将 几 个 数据 集 转换 成 一 个 理论 上 的 新 分 布 ， 这 个 分 布 的 均值 为 0， 


标准 差 为 1， 这 是 一 种 可 用 于 进行 比较 的 通用 分 布 。 标 准 分 将 你 的 数据 有 效 地 转化 
为 符合 这 个 模型 的 数据 ， 同 时 确保 数据 的 基本 形状 不 变 。 





标准 分 可 以 取 任 意 值 ， 这 些 值 表示 相对 于 均值 的 位 置 。 正 的 z 分 表示 数值 高 于 
均值 ， 负 的 z 分 表示 数值 低 于 均值 。 若 z 分 为 0， 则 数值 等 于 均值 本 身 。 数 值 大 
小 体现 了 数值 与 均值 的 距离 。 


距离 均值 若 于 个 标准 如 


有 时 候 ， 统 计 师 会 用 距离 均 做 千 个 标准 差 表示 某 个 特定 数值 的 相对 位 置 。 未 着 分 二 距离 元 
例如 ， 统 计 师 可 能 会 说 某 个 特定 值 在 蝶 离 均值 1 个 标准 差 的 范围 内 ， 这 其 实 只 et 
不 过 是 表示 数值 距离 均值 远近 的 另 一 种 方法 它 有 何 实际 意义 呢 ? 值 的 标准 差 个 数 


我 们 已 经 讲 过 如 何 通 过 z 分 将 数据 集 转化 为 一 个 均值 为 0、 标 准 差 为 1 的 通用 分 
布 。 如 果 一 个 数值 在 上 距离 均值 1 个 标准 差 的 范围 内 ， 我 们 就 知道 ， 数 值 的 标准 
分 在 -1 到 1 之 间 。 与 此 类 似 ， 如 果 一 个 数值 在 距离 均值 两 个 标准 差 的 范围 内 ， 
则 数值 的 标准 分 在 -2 到 2 之 间 。 















p 总 昌 一 个 束 什 位 于 丝 高 夫 


本 范围 内 ， 
: 人 1 个 容 准 差 的 把 
= 向 。 束 据 风 中 心 共 因 ， 
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世上 没有 傻 问 题 


世上 没有 俐 问题 


阅 : 既然 方差 和 标准 差 都 能 量度 数据 的 分 散 程度 ， 
那么 它们 与 全 距 有 何 区 别 ? 


答 :全 距 是 一 种 极其 简单 的 量度 数据 分 散 程度 的 
方法 ， 它 指出 最 大 值 和 最 小 值 之 间 的 差 值 ， 但 仅 此 而 
已 ， 你 无 法 看 出 教 据 在 这 个 差 值 范围 内 的 聚 散 情况 。 
用 方差 和 标准 差 方法 量度 数据 的 变异 性 和 分 布 形态 则 
效果 好 得 多 ， 因 为 这 二 者 考虑 了 数据 的 聚 散 情况 ， 它 
们 关注 的 是 典型 情况 下 的 数值 与 数据 中 心 的 距离 。 
阅 :方差 和 标准 差 有 何 区 别 ? 我 该 用 哪 一 个 ? 
签 : 标准 差 是 方差 的 平方 根 ， 这 说 明知 道 其 中 一 
个 就 可 以 求 出 另 一 个 。 

标准 差 可 能 是 最 直观 的 方法 ， 因 为 它 粗 略 地 体现 了 平 
均 情况 下 的 数值 与 均值 的 距离 。 


E> 点 


m ”方差 和 标准 差 通 过 观察 数值 与 均值 的 距离 量度 
数值 的 分 布 形态 。 


@ 方差 有 两 种 计算 方法 ， 其 一 : 


Ex-p) 


n 
@ ”其 二 : 
2 
ZX 
n 
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阅 : 标准 分 是 如 何 介入 以 上 方法 的 ? 

签 ; 标准 分 利用 均值 和 标准 差 ， 将 一 个 数据 集中 
的 各 个 数值 转化 为 更 通用 的 分 布 形 态 ， 同 时 确保 数据 
的 基本 形状 不 变 。 

标准 分 是 对 不 同 数据 集中 的 数值 进行 比较 的 一 种 广 
法 一 即使 各 个 数据 集 的 均值 和 标准 差 各 不 相同 也 能 
进行 比较 ， 这 是 一 种 量度 相对 排名 的 方法 。 


| 问 :标准 分 和 异常 值 检测 有 什么 关系 吗 ? 


答 : 


问 得 好 ! 我 们 可 以 赁 主观 判断 确定 异常 值 ， 


但 有 时 候 可 以 将 异常 值 定义 为 偏离 均值 三 个 标准 差 的 
数值 。 
不 过 统计 学 家 对 此 尚 有 分 歧 ， 因 此 请 小 心 对 待 。 


标准 差 是 方差 的 平方 根 ; 方差 是 标准 差 的 平方 。 





标准 分 ( 或 称 z 分 ) 是 对 不 同 数据 集中 的 数 
值 进行 比较 的 一 种 方法 ， 这 些 数据 集 的 均值 
和 标准 差 豆 不 相同 。 数 值 x 的 标准 分 的 计算 
方法 为 : 


x-b 
oOo 


Zz= 


强大 的 “8E” 


境 写 下 表 。 写 出 我 们 在 本 章 讲 过 的 各 种 量度 分 布 形态 的 方法 ,说 明 如 何 进行 计算 ， 
请 尽量 不 要 回头 翻阅 本 章 前 面 的 内 容 。 


上 四 分 位 数 - 下 四 分 位 数 
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练习 解答 


填写 下 表 。 写 出 我 们 在 本 章 见 到 过 的 各 种 重度 分 散 性 的 方法 ， 说 明 如 何 进行 计算 ， 请 
狼 习 尽量 不 要 回头 翻阅 本 章 前 面 的 内 容 。 


解答 


丰 


距 
分 个 


如 何 计算 
上 界 - 下界 












上 四 分 位 数 - 下 四 分 位 数 


畏 


标准 差 ( 可 } 
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加 种 算法 结果 相同 . 







TS 
< 一 


强大 的 “ 距 ” 


统计 帮 全 明星 篮球 队 赢 了 联赛 ! 


现在 ， 整 个 赛季 的 所 有 比赛 都 结束 了 ， 统 计 邦 全 明星 篮球 队 在 
联赛 中 排名 第 一 。 很 显然 ， 是 你 帮助 教练 选 出 了 最 适合 球 队 的 
队员 ， 


别 忘 了 ， 这 可 都 多 亏 标准 差 这 位 好 朋友 的 帮助 





让 我 们 为 球 队 的 新 十 祥 
物 一 标准 卷 欢 呼 吧 ! 
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4 概率 计算 


把 握 机 会 


他 记 信 我 对 非 焉 金属 过 教 
的 概率 有 多 大 ? 







wo 


人 生 无 常 


瞬息 之 间 的 变化 有 时 难以 一 料 定 。 但 有 些 事情 会 比 其 他 事情 更 有 可 能 发 生 ， 
这 就 为 概率 理论 提供 了 大 显 身手 的 舞台 。 通 过 概率 能 评估 出 现 各 种 结果 的 可 
能 性 ， 让 你 预测 未 来 。 知 悉 可 能 出 现 的 结果 则 可 帮助 你 作出 有 根据 的 决策 。 
本 章 将 让 你 了 解 更 多 概率 知识 ， 学 会 如 何 掌 控 未 来 ! 
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欢迎 来 到 肥 蛋 赌场 


肥 蛋 赌场 是 当地 最 热门 的 赌场 ， 赌 博 游戏 应 有 尽 oD 
有 一 轮 盘 、 老 虎 机 、 扑 克 牌 、 二 十 一 点 …… 赌 场 

正好 你 今天 吉星 高 照 ，Head First 实 验 室 给 了 你 一 沪 沈 

大 堆 筹 码 ， 让 你 去 肥 蛋 挥 址 ， 赢 了 钱 全 归 你 。 想 去 

试 试 ? 那 就 走 吧 一 就 知道 你 动心 了 。 





可 以 开始 了 吗 ? 





肥 自 赌场 应 容 之 一 





轮 盘 财运 转正 柄 ， 下 一 局 正 要 开始 ， 让 我 们 看 
看 你 运气 如 何 。 
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把 握 机 会 


转 起 来 吧 ， 轮 盘 ! 


就 算 你 没有 亲自 玩 过 轮 盘 赌 ， 总 在 电影 里 见 过 吧 一 庄家 
转动 一 个 轮 盘 ， 随 后 朝 相 反方 向 掷 出 一 个 小 球 ， 赌 者 将 赌 
注 押 在 他 所 料 定 的 停 球 位 置 。 


肥 蛋 赌场 所 用 轮 盘 有 38 个 停 球 位 置 ， 主 球 位 编号 1 一 36， 
颜色 或 黑 或 红 ; 另 有 两 个 球 位 编号 0 和 00， 均 为 绿色 。 


用 色 一 时 2 


大 色 二 红包 


轮 盘 赌 的 下 注 方式 五 花 八 门 。 例 如 ， 你 可 以 赌 一 个 特定 数字 
(奇偶 均 可 ) ,可 以 赌球 位 颜色 ， 开 局 后 还 会 有 人 宣布 各 种 
其 他 赌 法 。 再 就 是 记 住 : 如 果 球 停 在 绿色 球 位 ， 你 就 输 了 。 


使 用 轮 盘 板 可 以 方便 地 查看 数字 与 颜色 组 合 。 










轮 盘 极 (大 图 
参见 130 页 ) . 一 之 





你 在 轮 盘 极 上 的 球 位 上 
下 注 ， 贱 小 球 会 停 在 煞 ; 
理 上 的 某 个 球 位 上 ， N em 
要 是 球 停 在 0 或 00 
球 位 ， 你 就 输 了 ! 前 12 位 中 12 位 后 12 位 





EK EI 
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一 一 


< OO MN AN 


一 | 一 AN Nm 


Or 


你 的 专 同 论 盘 板 


在 本 章 中 ， 你 将 在 轮 盘 上 大 赌 特 赌 。 这 里 有 一 件 称 手 
的 轮 盘 板 ， 请 前 下 来 保存 好 。 你 可 以 借助 它 计算 本 章 


要 讲 的 概率 。 
全 小 心 前 刀 . 






轮 盘 板 


深入 浅 出 统计 学 


130 


下 注 了 ! 


轮 盘 板 剪 好 了 ? 赌局 正 要 开始 。 你 料想 球 会 停 在 哪 
里 ? 在 你 的 轮 盘 板 上 选择 一 个 号 码 ， 然 后 下 注 。 









打 伟 吧 ! 由 果 挤 随机 稿 测 ? 
那样 就 别 指 诺 有 机 会 赢 贱 了 ， 






如 动 动 脐 


在 轮 盘 赌 中 下 注 前 需要 考虑 什么 ? 若 有 机 会 
下 注 ， 你 会 下 哪 种 注 ? 为 什么 ? 


把 握 机 会 


正确 。 在 下 注 之 前 ， 很 有 必要 看 看 你 有 几 成 胜算 。 


也 许 赌 中 某 些 号 码 的 可 能 性 比 另 一 些 号 码 的 可 能 性 更 
大 。 似 乎 我 们 应 该 来 看 几 个 概率 …… 
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求 出 概率 


几率 有 有 多 大 ? 


当 你 正在 思念 朋友 ,恰好 有 一 位 朋友 就 给 你 来 了 电话 ， 或 者 你 买 的 
彩票 中 了 头等 奖 …… 每 当 这 时 ， 你 会 不 会 这 样 想 ，“ 那 么 ， 这 件 率 
的 发 生 几 率 有 多 大 ? “ 


概率 是 量度 某 事 发 生 几 率 的 一 种 数 其 指标 。 你 可 以 用 概率 衡量 发 生 


某 件 事 的 可 能 性 〈 例如 你 在 本 周 某 一 时 刻 会 进 和 人 梦乡 的 可 能 性 ) ， 


或 不 会 发 生 某 事 的 可 能 性 ( 例如 在 你 徒步 穿越 沙漠 时 ， 草 原 狼 企 
图 用 耳朵 里 的 砧 骨 擅 翻 你 的 可 能 性 ) 。 统 计 学 用 “事件 ”一 词 表 
示 有 概率 可 言 的 任何 事情 ， 换 句 话 说， 事件 就 是 人 们 能 指出 其 发 
生 可 能 性 的 任何 事情 。 


概率 的 量度 尺度 是 0 一 1。 如 果 某 件 事 不 可 能 发 生 ， 则 其 概率 为 0; 
如 果菜 件 事 肯 定 会 发 生 ， 则 其 概率 为 1。 大 多 数 时 候 ， 你 所 面 对 
的 都 是 介 于 0 和 1 之 间 的 概率 。 








发 生 与 不 发 生 
下 面 是 用 概率 比例 尺 示 意 的 几 个 例子 。 的 几率 相等 肯 完 
未 可 能 山 区 
Nio 0.5 1 

和 划 原 砍 砧 骨 蒙 击 之 类 网 挪 出 一 枝 硬币 ， 却 在 长 和 168J. 时 鹃 一 

性 带 极 处 可 储 发 生 ， 让 币 正 面 朝 上 的 决 数 段 时 间 内 ， 在 某 个 

慌 们 把 这 件 事 标 在 这 儿 。 占 所 有 次数 的 一 如 时 刘 进 入 梦乡 的 可 

能 性 几乎 确 费 无 蜂 ， 






有 概率 可 言 的 一 个 结果 或 一 
件 事 。 
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能 看 出 概率 与 轮 盘 同 的 关系 吗 ? 


如 果 你 知道 小 球 停 在 某 个 特定 编号 或 颜色 上 
的 可 能 性 大 小 ， 就 能 够 判断 是 否 该 下 某 个 赌 
注 。 若 想 在 轮 盘 赌 中 赢 钱 ， 人 懂得 概率 是 非常 
有 用 的 。 


把 握 机 会 


RR 


让 我 们 来 算出 一 个 与 轮 盘 有 关 的 概率 : 小 球 停 在 数字 7 上 的 概率 。 
下 面 一 步 一 步 进 行 演示 。 





1. 观察 你 的 轮 盘 板 。 有 多 少 个 球 位 可 供 小 球 停留 ? 


2. 数字 7 有 几 个 球 位 ? 


3. 为 了 算出 “ 停 球 结果 为 了 ”的 概率 ， 用 问题 2 的 答案 除 以 问题 1 的 答案 。 结 果 如 何 ? 


4. 将 以 上 概率 标 在 下 面 的 比例 尺 上 。 你 会 怎么 描述 “ 停 球 结果 为 7” 这 件 事 的 可 能 性 大 小 ? 
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动 动笔 解答 


“> 


1. 观察 你 的 轮 盘 板 。 有 多 少 个 球 位 可 供 小 球 停留 ? 


看 38 个 建 伍 。 二 一 - 别 记 了 : 像 停 在 其 他 36 个 壮 位 上 一 样 ， 
小 于 证 可 能 痊 在 0 和 00 球 位 上 ， 


已 臣 


解 带 你 必须 算出 一 个 与 轮 盘 有 关 的 概率 小 球 停 在 数字 7 上 的 概率 。 
下 面 我 们 一 步 一 步 进行 演示 。 









2. 数字 7 有 几 个 球 位 ? 
只 有 1 个 


3. 为 了 算出 “ 停 球 结果 为 了” 的 叔 率 ， 用 问题 2 的 答案 除 以 问题 1 的 答案 。 结 果 如 何 ? 
“和 于 结果 为 7” 的 模 刘 一 一 


= 0.026 
人 一 我 们 网 答案 ， 保 留 三 位 小 数 ， 


4. 将 以 上 概率 标 在 下 面 的 比例 尺 上 。 你 会 怎么 描述 “ 停 球 结果 为 7” 这 件 事 的 可 能 性 大 小 ? 


TS 


“ 停 球 千 果 为 7 
位 置 。 这 个 结 时 


的 往 率 为 0.026 . 因此 是 在 这 个 
状 非 式 可 能 ， 但 可 能 性 也 乐土 。 
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把 握 机 会 


求解 轮 人 盘 概 率 


让 我 们 好 好 看 看 这 个 概率 是 怎么 计算 出 来 的 。 







下 面 是 转动 轮 盘 可 能 得 到 的 所 有 结果 。 我 们 真正 感 兴趣 的 
是 押 中 赌注 一 即 ， 球 落 在 数字 7 上 





为 了 求 出 押 中 赌注 的 概率 ， 我 们 用 押 中 赌注 的 可 能 数目 除 以 
可 能 出 现 的 结果 的 数目 ， 如 下 所 示 : 


_ 中卫 注 的 可 能 财 目 < 41 入 ,区 位 和 2， 
所 有 可 能 结果 的 数目 


我 们 还 可 以 用 一 种 更 通用 的 方法 表述 以 上 情况 ， 对 于 事件 A 


的 概率 : 儿科 A 
A pe 
发 生 事件 A 的 概率 —> P(A) = n(A) ) 
n(S)— 所 有 可 能 千 
果 钠 数目 


S 被 称 为 概率 空间 ， 或 称 样本 空间 ， 是 表示 所 有 可 能 结果 的 
-种 简便 表示 法 。 可 能 发 生 的 事件 都 是 S 的 子 集 。 
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概率 租 维 轴 狼 


维 思 图 : 概率 的 图 形 表 示 


概率 计算 有 时 很 复杂 ， 因 此 ， 用 图 形 方式 表示 窒 率 往 
往 十 分 有 用 。 其 中 有 一 个 办 法 是 这 样 的 : 画 一 个 方 杠 
代表 样本 空间 S， 然 后 画 凡 个 贺 圈 代表 各 个 相关 事件 ， 
这 种 图 称 为 维 转 图 。 下 面 是 我 们 的 轮 盘 问题 的 维 恩 图 ， 
其 中 和 A 为 “ 停 球 结果 为 ?” 这 一 事件 。 


凤 加 的 实际 大小 并 不 重要 ， 电 不 妈 


示 一 个 事 件 的 相对 横 主 ， ep ee 
图 中 包含 什么 以 及 系 包 爹 全 么 。 





维 恩 图 上 不 标 出 数字 本 身 ， 这 是 士 分 常见 的 做 法 。 你 
可 以 选择 在 图 上 标 出 每 一 事件 的 实际 概率 ,以 此 取代 
数字 。 具 体 做 法 完全 取决 于 你 解决 问题 时 唤 要 用 到 的 
信息 。 


对 立 事 件 


“A 不 发 生 ” 事 件 有 一 种 简便 表示 方法 一 - A。A 被 称 
为 A 的 对 立 事件 。 


计算 P(A') 有 一 种 巧妙 的 方法 。A' 包 含 事件 A 所 不 包含 
的 所 有 可 能 性 ， 因 此 二 者 ， 即 A 和 A'， 肯 定 包 含 每 一 
种 可 能 发 生 的 事件 。 如 果 某 件 事 属 于 A， 就 不 可 能 属 
于 A'; 奶 果 某 件 事 不 属于 A， 就 必定 属于 A'。 这 意 球 
着 ,要 是 将 P(A) 和 和 P(A') 加 起 来 ， 结 果 为 1 。 也 就 是 说 ， 
某 件 事 属于 A 或 属于 A' 的 几率 为 100%。 于 是 我 们 得 出 : 


P(A) + P(A) = 1 


P(A') = 1 - P(A) 
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这 张 图 上 标 出 歇 未 
是 22， 而 是 A'， 以 
财 表 示 所 有 亲属 
于 A 的 可 能 事件 . 


把 握 机 会 


化 身上 应 稍 


你 的 任务 是 把 自己 想 泉 成 这 位 庄 
宗 ， 算 出 各 种 事 售 的 概率 。 针 对 
下 列 每 一 事件 ， 写 出 获得 成 功 的 
概率 。 





P(9) R( 绿 ) 


P( 黑 ) Pp(38) 
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化 身 庄 家 解答 


化 身上 庄 象 解 管 


你 前 任务 是 把 自己 想 篆 成 这 位 庄 
家 ， 算 出 各 种 事件 的 概 宰 。 针 对 
下 列 每 一 和 事件， 你 应 该 已 经 获得 





P(9) 


P( 绿 ) 


“ 停 球 结果 为 9?” 的 概率 与 “ 停 球 结果 为 7” 的 概率 


有 两 个 球 位 是 绿色 的 ， 且 总 共有 38 个 妹 位 ， 
完全 一 样 ， 因 为 小 球 共 入 这 两 个 壮 位 的 几率 相等 。 。 所以， 
1 2 
概率 = -一 概率 = -一 
38 38 
= 0.026 (保留 三 位 小 数 ) 三 0.053 (保留 三 位 小 数 ) 


Pl 黑 ) Pp(38) 


有 18 个 球 位 是 黑色 ， 且 共有 38 个 球 位 ， 所 以 : 实际 上 这 个 事件 未 可 能 发 生 ， 因 为 未 存在 


编号 为 38 的 球 位 。 因 此 ， 这 个 事件 的 概率 
概率 = Er 为 0. 
3 


= 0.474 (保留 三 位 小 数 ) 


在 讨论 欣 几 个 事件 中 ， 最 有 可 能 发 生 
摧 事 件 是 小 球 共 入 一 个 黑色 妹 位 ， 
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问 : 我 有 什么 必要 了 解 概率 呢 ? 
我 学 的 可 是 统计 学 。 


答 : 概率 与 统计 学 关系 十 分 密 
切 。 大 量 统计 知识 起 源 于 概率 理 
论 ， 因 此 懂得 概率 会 让 你 的 统计 
学 技术 登 上 一 个 新 台阶 。 概 率 理 
论 能 帮助 你 进行 预测 ， 发 现 模式 ， 
能 帮助 你 穿 进 表面 上 的 随机 性 著 
取信 息 。 接 下 来 我 们 将 会 详 加 讲 
述 。 


半 : 概率 是 以 分 数 、 小 数 还 是 百 
分 数 表 示 ? 


现在 该 动手 玩 了 ! 


一 局 轮 盘 赌 即将 开局 。 


观察 前 一 页 提 到 的 几 个 事件 ， 我 们 将 把 赌 
注 押 在 最 可 能 发 生 的 事件 上 一 -小 球 会 停 


在 黑色 球 位 。 


世上 没有 俐 问题 


答 : 可 以 用 其 中 任意 一 种 ， 这 
并 不 重要 ， 只 要 是 介 于 0 至 1 之 间 
的 数值 即 可 。 


问 : 我 以 前 在 集合 论 中 看 到 过 维 
恩 图 ， 这 其 中 有 关联 吗 ? 


答 : 当然 有 。 在 集合 论 中 ， 样 
本 空间 等 于 所 有 可 能 结果 的 集合 ， 
而 可 能 事件 则 是 这 个 集合 的 子 集 。 
不 过 ， 你 不 必 为 了 使 用 维 思 图 计 
算 概率 而 事先 搞 履 集合 论 ， 因 为 
我 们 会 在 本 章 介绍 你 需要 知道 的 
各 种 知识 。 





把 握 机 会 


| 问 : ”我 必须 画 维 恩 图 吗 ? 我 注意 
到 你 在 上 一 个 练习 中 并 没有 画 。 


从 : 不 是 必须 要 画 。 但 有 时 
候 ， 在 用 图 形 方式 表示 概率 问题 
时 ， 维 思 图 会 是 有 用 的 工具 。 接 
下 来 你 将 看 到 更 多 有 关 维 思 图 发 挥 
帮助 作用 的 例子 


问 ; ”有 没有 什么 东西 能 同时 存在 
于 事件 A 和 事件 A' 中 ? 


答 : 没有 。A' 的 意思 是 不 存在 
于 A 中 的 各 种 事物 。 如 果 某 个 要 素 
存在 于 A 中 ， 则 这 个 要 素 不 可 能 存 
在 于 A' 中 。 这 两 个 事件 是 互 斥 的 ， 
因此 二 者 不 会 共用 任何 要 素 。 


让 我 们 看 看 
结果 如 何 。 


第 4 章 概率 计算 139 


概率 并 非 担保 


赢 钱 的 数字 是 …… 


天 啊 ! 我 们 算出 的 最 可 能 概率 事件 是 小 球 停 在 黑色 
球 位 上 ， 可 结果 呢 ， 它 停 在 了 绿色 0 球 位 上 。 你 输 








掉 了 一 些 筹码 。 中 
4 一 一 上 ， 因 此 你 输 —> E33 
\， 捧 了 一 些 算 码 . ie 

N az 

“ SN 








肯定 有 和 补救 办 法 ! 停 球 结 果 为 黑色 
的 概 率 远 远 高 于 停 妹 结果 为 绿色 (也 
就 是 0) 的 概率 .哪里 出 委 错 了 ? 我 要 
赢 钱 ! 


概率 只 是 对 事件 发 生 可 能 性 的 一 种 表达 ， 概 率 并 非 担保 。 

请 记 住 这 个 重要 事实 : 概率 仅仅 指出 长 期 趋势 。 如 果 你 打算 
玩 上 几 千 次 轮 盘 赌 ， 你 可 能 该 期 盼 每 转 38 次 有 18 次 停 在 黑色 
球 位 上 ， 也 就 是 约 有 47% 的 时 候 停 在 黑色 球 位 上 ; 每 转 38 次 
有 2 次 停 在 绿色 球 位 上 ， 也 就 是 约 有 5% 的 时 候 停 在 绿色 球 位 
上 。 即 使 你 有 理由 如 此 期 盼 一 - 小 球 停 在 绿色 球 位 的 相对 次 
数 较 少 ， 但 这 并 不 意味 着 小 球 停 在 绿色 球 位 的 结果 不 会 发 生 





无 论 东 事件 多 么 不 可 能 发 生 ， 
只 要 不 是 完全 不 可 能 发 生 ， 该 
事件 就 仍然 可 能 发 生 。 
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把 握 机 会 


让 我 们 赌 一 个 可 能 性 更 大 的 事件 


让 我 们 看 一 个 更 有 可 能 发 生 的 事件 的 概率 。 这 次 我 们 不 押 
小 球 会 停 在 黑色 球 位 ， 而 押 小 球 会 停 在 黑色 或 红色 球 位 。 
为 了 算出 概率 ， 我们 需要 数 出 有 多 少 球 位 是 红色 或 黑色 ， 
用 结果 除 以 总 球 位 数 。 听 起 来 是 不 是 很 简单 ? 








要 数 绝 妹 位 可 未 少 。 我 们 
已 经 算出 P( 黑 ) 和 P( 绿 ) ， 也 
许可 以 用 其 中 之 一 进行 计算 ， 
那 就 未 用 数 了 . 

















我 们 可 以 用 已 知 的 概率 算出 未 知 的 概率 。 


看 看 你 的 轮 盘 板 。 小 球 只 会 停 在 三 种 颜色 上 : 红色 ， 黑 
色 ， 绿 色 。 由 于 我 们 已 经 算出 P( 绿 )， 于 是 可 以 用 这 个 值 
和 求 出 概率 ， 而 不 必 数 出 所 有 的 黑色 和 红色 球 位。 


P( 黑 或 红 ) = P( 绿 1 
= 1 一 P( 绿 ) 
= 1 -0.053 


= 0.947 (保留 三 位 小 数 ) 


口 说 无 凭 。 数 出 黑色 球 位 或 红色 球 位 的 个 数 ， 用 结果 除 以 总 球 位 
数 ， 由 此 算出 停 球 结果 为 黑色 或 红色 的 概率 。 
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概率 相 加 动 动 苞 
DP 


P( 黑 或 红 ) 










口 说 无 凭 。 数 出 黑色 球 位 或 红色 球 位 的 个 数 ， 用 结果 除 以 总 球 位 
数 ， 由 此 算出 停 球 结果 为 黑色 或 红色 的 概率 。 





二 0.947 (保留 三 位 小 数 ) 
于 是 : P( 黑 或 红 ) = 1- PP( 绿 ) 


你 还 可 以 将 几 个 概率 相 加 
”可 能 上 生 红色， 
还 有 一 种 方法 可 以 求 出 以 上 概率 。 如 果 已 知 P( 黑 ) 和 P( 红 )， 内 位 不 一流 二 学 和 
我 们 可 以 将 这 两 个 概率 加 起 来 ， 得 出 停 球 结果 为 黑色 或 红 和 二 
的 概率 。 让 我 们 算 算 看 。 
色 的 概率 。 让 我 们 算 算 看 ti 
有 两 个 球 仁 用 未 是 红色 也 


是 里 色 ， 因此 将 2 写 在 这 里 。 


18 + 18 
P( 黑 或 红 )= 一 





= P( 黑 ) + P( 红 ) 


在 本 例 中 ， 将 几 个 概率 相 加 得 出 的 结果 与 数 出 所 
有 红色 或 黑色 球 位 数 再 除 以 38 的 结果 完全 相同 。 
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把 据 机 会 





重要 统计 县 _ 个 必 重 要 统计 星 


概率 


如 需 囊 一 个 事件 A 的 概率 ， 壮 
法 地 下 ， 













P(A) = 人 
n(Ss) 





i 








人 入 是 A 的 对 立 事 件 ， 即 事件 A 
了 可 能 发 生 拘 事件 ， 它 网 摄 率 









P(A) = 1 -P(A) 


世上 没有 俐 问题 


阅 ; 似 平 求解 以 上 概率 有 三 种 方法 ， 哪 一 种 方法 最 好 ? 


签 : 这 取决 于 特定 情况 以 及 你 拥有 的 信息 。 
假定 你 拥有 的 关于 轮 盘 县 的 唯一 信息 是 停 球 结果 为 绿 
色 的 概率 ， 在 这 种 情况 下 ， 就 必须 通过 计算 小 球 不 停 
在 绿色 球 位 的 概率 ，; 

1 ~ P( 绿 ) 
来 计算 要 求 的 概率 。 


另 一 方面 ， 如 果 已 知 P( 黑 } 和 P( 红 )， 但 颜色 数目 未 知 ， 则 
必须 通过 将 B( 军 ) 和 P( 红 ) 扫 加 来 计算 要求 的 概 替 。 


阅 :这 么 说 我 不 用 为 了 计算 概率 而 没完 没 了 去 数 数 了 ? 


答 ; 透 常 不 用 ， 但 还 得 看 情况。 不 管 怎么 样 ， 复 术 
一 下 关 果 还 是 会 有 用 的 。 


问 : 如 果 竣 些 事件 发 生 的 概率 很 人 小， 人们 为 什么 还 要 
赌 它 发 生 呢 ? 


答 : 这 和 庄家 所 承诺 的 回报 有 很 大 关系 。 一 般 说 
来 ， 事 件 的 发 生 可 能 性 越 小 ， 事 件 发 生 时 的 回报 就 越 
大 。 如 果 赌 中 的 事件 发 生 概 率 很 高 ， 那 么 赢 的 钱 就 不 
会 多 。 人 伯 有 时 会 对 回报 率 高 的 事件 孤注一掷 ， 即 使 
赌 蔬 的 几率 微 卑 其 袜 也 不 展 一 捕 。 


阅 : 像 网 才 那 样 将 概率 加 起 来 总 能 获得 正确 结果 凤 ? 


答 ; 请 把 这 当 作 一 个 特例 。 其 他 情况 我 们 将 在 接 下 
来 的 几 页 中 详细 讲解。 
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一 个 新 赌注 


你 赢 钱 了 ! 


这 一 回 ， 小 球 停 在 红色 球 位 上 ， 数 字 是 7， 因 此 你 赢 了 二 厅 束 
- 些 筹码 这 一 国 。 你 时 了 


,2 4 j 筷 EE I 名. 球 伍 ， 
EC 有 





再 贱 一 局 


既然 你 已 经 掌握 了 计算 概率 的 窍门 ， 那 就 让 我 们 试 着 
算 点 别 的 东西 吧 : 小 球 停 在 黑色 或 偶数 球 位 上 的 概率 


是 多 少 ? 












这 个 容易 。 我 们 只 要 
将 里 色 概 率 和 偶数 概率 
加 起 来 . 





有 了 时候 你 可 以 把 几 个 概 来 ， 
不 是 在 任何 情况 下 都 管用 。 


我 们 可 能 无 法 指望 能 用 和 前 面 完全 一 样 的 算法 
计算 这 个 概率 。 试 着 做 一 做 下 一 页 的 练习 ， 看 


看 结果 如 何 


一 招 并 
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把 握 机 会 


必 艺 动 艺 


S 让 我 们 求 出 “ 停 球 结果 为 黑色 或 偶数 ”的 概率 ( 假设 0 和 
00 不 是 偶数 ) 。 


1. “ 停 球 结果 为 黑色 ”的 概率 是 多 少 ? 
2. “ 停 球 结果 为 偶数 ”的 概率 是 多 少 ? 
3. 将 以 上 两 个 概率 相 加 ， 结 果 如 何 ? 


4. 最 后 ， 用 你 的 轮 盘 板 数 出 所 有 的 黑色 或 偶数 球 位 ， 然 后 除 以 球 位 总 数 。 结 果 如 何 ? 





Er EI 


0 
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动 动笔 解答 


~ 


1. “ 停 球 结果 为 黑色 ”的 概率 是 多 少 ? 
18/38 = 0.474 


甸 和 


解 总 让 我 们 求 出 “ 停 球 结果 为 黑色 或 偶数 ”的 概率 ( 假设 0 和 00 不 是 
偶数 ) 。 





2.“ 停 球 结 打 为 偶数 ”的 概率 是 多 少 ? 


18/ 38 = 0.474 


3. 将 以 上 两 个 概率 相 加 ， 结 果 如 何 ? 


0.947 


4. 最 后 ， 用 你 的 轮 盘 板 数 出 折 有 的 黑色 或 偶数 球 位 ， 然 后 除 以 球 位 总 数 。 结 果 和 如何 ? 


26/ 38 = 0.684 


知 区 不 一 上 


哎 咀 ! 


我 没 理 风 旬 .上 一 次 把 概 
此 加 起 来 是 对 的 ， 哪 忆 算 
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豆 斥 事件 与 相交 事件 


把 所 机 会 


在 我 们 计算 小 球 停 在 黑色 球 位 或 红色 球 位 上 的 概率 的 时 候 ， 所 面 
对 的 是 两 个 互 斥 事件 一 小 球 停 在 黑色 球 位 上 、 小 球 停 在 红色 球 
位 上 。 由 于 小 球 不 可 能 既 停 在 黑色 球 位 上 ， 又 停 在 红色 球 位 上 ， 


因此 这 两 个 事件 是 互 斥 的 。 












我 们 没有 仁 何 担 同 之 
处 。 我 们 是 互 斤 事件 。 


黑色 球 位 事件 和 偶数 球 位 事件 又 是 怎样 的 关系 呢 ? 这 一 次 ， 


这 两 个 事件 不 互 斥 ， 小 球 有 可 能 既 停 在 黑色 球 位 上 ， 又 停 在 
偶数 球 位 上 。 这 两 个 事件 是 相交 事件 。 





我 稿 这 意味 着 我 
们 拥有 共同 领域 。 


有 沁 球 位 既是 黑色 
沿 ， 又 是 偶数 的 . 


如 果 两 个 事件 是 互 
斥 事件 ， 则 只 有 其 
中 一 个 事件 会 发 生 。 


如 果 两 个 事件 相交 ， 
则 这 两 个 事件 有 可 
能 同村 发 生 。 


他 动 动 及 
你 觉得 这 种 相交 状况 会 对 概率 有 何 
影响 ? 
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交集 与 并 集 


交集 带 来 的 问题 


“ 停 球 结果 为 黑色 或 偶数 ”的 计算 结果 之 所 以 出 现 差异 ， 
是 因为 我 们 将 “黑色 兼 偶数 ” 球 位 算 了 两 次 。 下 面 是 具 
体 分 析 。 


首先 ， 我 们 求 出 “ 停 球 结果 为 黑色 ”的 概率 以 及 “ 停 
球 结果 为 偶数 ”的 概率 。 


黑色 
18 18 
P( 黑 ) = 一 P( 偶 ) = 一 
38 38 
= 0.474 = 0.474 





当 将 两 个 概率 相 加 时 ， 我 们 将 停 球 结果 为 “黑色 兼 偶 
数 ” 的 概率 算 了 两 次 . 


黑色 偶数 


为 了 得 出 正确 的 答案 ， 须 减 去 停 球 结果 为 “黑色 兼 偶 
数 ” 的 概率 。 得 到 : 





筑 一 决 ， 因 沸 
得 拨 欣 部 分 。 


3 人 ~ 这 一 部 分 只 和 能 
P( 黑 或 偶 ) = P( 黑 ) + P( 偶 ) - P( 黑 兼 偶 ) i 


下 面 可 以 代入 我 们 前 面 算出 的 值 ， 以 便 求 出 P( 黑 或 偶 ): 


P( 黑 或 偶 ) = 18/38 + 18/38 - 10/38 = 26/38 = 0.684 
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把 握 机 会 


更 多 表示 法 

还 有 一 种 更 通用 的 表示 法 ， 其 中 使 用 了 更 多 简便 的 NN 人 

数学 符号 。 和 集 
2 


首先 ， 我 们 可 以 用 APmB 表 示 “A 与 B 的 交集 ”， 你 可 
以 把 这 个 符号 理解 为 “与 ”， 它 求 出 不 同事 件 的 共 
同 要 素 。 这 里 的 去 集 是 A fi 台 。 

S 


另 一 方面 ，AUB 则 表示 “A 与 B 的 并 集 ”， 它 包含 属于 
A 及 B 的 所 有 要 素 ， 你 可 以 把 这 个 符号 理解 为 “或 ”。 
如 果 P(AUB)=1， 则 我 们 说 A 与 B 穷 举 。 它 们 一 起 形成 
整个 S$， 它 们 穷 举 所 有 可 能 性 。 
也 系 属 于 已 ， 
S 有 不 有 有 在， 如 不 局 人 


扣 者 说 不 属于 二 者 的 要 前 eh 
则 A 和 忆 狠 穷 举 了 ， 图 上 










你 个 陶 影 部 分 
AAU E. 


我 们 在 上 一 页 得 出 


P( 黑 或 偶 ) = P( 黑 ) + P( 偶 ) - P( 黑 和 偶 ) 


请 用 mm 和 U 符 号 表示 上 式 。 





第 4 章 概率 计算 149 


动 动笔 解答 


P( 黑 或 偶 ) = P( 黑 ) + P( 偶 ) - P( 黑 和 偶 ) 


请 用 和 U 符 号 表示 上 式 。 


P(A UE)=P(A) + PE) -P(A NE) “ 所 一 一 
P(A 与 了 ) 














那么 互 斤 事 件 的 计算 式 为 什么 不 一 
样 ? 你 这 不 是 要 让 我 记 更 多 东西 吗 ? 


实际 上 并 无 太 大 差别 。 

互 斥 事件 之 间 并 无 相同 要 素 。 如 果 你 有 两 个 互 斥 事件 ， 则 “A 交 
B” 的 计算 结果 其 实 为 0 一 即 P(ANB) = 0。 让 我 们 再 看 看 黑色 球 
位 或 红色 球 位 的 例子 。 对 于 这 个 赌注 ， 轮 盘 上 的 “ 停 球 结果 为 红 
色 球 位 ”与 “ 停 球 结果 为 黑色 球 位 ”这 二 者 是 互 斥 的 ， 因 为 球 位 
不 可 能 既是 红色 又 是 黑色 ， 即 P( 黑 几 红 ) = 0， 因 此 表示 这 一 部 分 


的 等 式 就 不 见 了 。 





互 斥 与 穷 举 的 差别 
如 果 事件 A 与 事件 B 为 互 斥 事 
处 心 ) 件 , 则 
: P(ANB)=0 


如 果 事件 A 与 事件 B 为 穷 举 事件 ， 则 
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把 所 机 会 


化 身 术 地 


你 的 任务 是 扮演 概率 ， 把 维 
县 、 思 因 上 代表 下 列 概 字 的 部 位 
和 洲 上 阴影。 







P(ANB) +P(ANB) 


P(A'NM B') 


P(A WU B) - P(B) 
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化 身 概 率 解答 


化 身 梳 潍 解 管 


把 维 思 图 上 代表 下 列 概率 的 部 
位 涂 上 阴影 。 





PIAnB)+P(An BI) 


P(A'N B) 


P(A U B)- P(B) 
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把 所 机 会 


Head First 健康 俱乐部 有 50 位 运动 爱好 者 接受 了 调查 ， 调 查 问 及 他 们 是 否 打 棒 球 、 篮 球 或 踢 
足球 。 结 果 有 10 位 运动 爱好 者 仅 打 棒 球 ，12 位 仅 踢 足球 ，18 位 仅 打 篮球 ; 6 位 既 打 棒球 又 打 
篮球 ， 但 不 跑 足 球 ; 4 位 既 踢 足球 又 打 篮 球 ， 但 不 打 棒 球 。 


画 一 张 维 恩 图 代表 这 个 概率 空间 。 总 共有 几 位 运动 爱好 者 打 和 棒球 ? 几 位 打 篮 球 ? 几 位 踢 足球 ? 


以 上 运动 花 名 册 有 没有 互 斥 的 ? 哪些 运动 是 穷 举 的 { 填 满 慨 率 空间 ) ? 





入 要 统计 竖 
A 式 


的 了 囊 出 以 事件 A 或 已 为 结果 的 概 
率 ， 可 以 使 用 下 列 算法 : 











P(AUE) = P(A) + PE) - P(A U BE) 
LU 表示 “或 “ 


站 表示 “与 ” 
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练习 解答 


Head First 健 康 俱乐部 有 50 位 运动 爱好 者 接受 了 调查 ， 调 查 问 及 他 们 是 答 打 棒 球 、 篮 球 或 踊 
足球 。 结 果 有 10 位 运动 爱好 者 仅 打 棒 球 ，12 位 仅 踢 足 球 ，18 位 仅 打 篮 球 ; 6 位 既 打 棒球 又 打 


篮球 ， 但 不 踢 足 球 ; 4 位 既 踢 足球 又 打 篮 球 ， 但 不 打 棒 球 。 


画 一 张 维 恩 图 代表 这 个 概率 空间 。 总 共有 几 位 运动 爱好 者 打 棱 球 ? 几 世 打 篮 球 ?” 几 位 跑 足球 ? 
以 上 运动 花 名 册 有 没有 互 斥 花 名 册 ? 哪些 运动 是 穷 举 的 境 满 概率 空间 ) ? 


棒球 


将 已 知 数据 多 部 加 
起 来 ， 络 果 为 50， 


印 运动 爱好 者 总 数 ， 


僵 球 


是 球 


轿 上 的 信息 看 起 来 
镍 综 毛 系 ， 示 过 ， 
长 ” 失 制 准 思 图 特有 助 
于 我 们 看 浩 形 式 。 


通过 将 各 个 国生 中 的 数值 捐 加 ， 我 们 可 以 确定 : 棒球 爱好 者 的 总 数 为 16， 牙 
球 爱 好 者 的 总 数 光 28， 足球 爱好 者 拘 总 数 为 16， 


掉 球 事件 和 足球 事件 泡 互 斥 事 件 ， 浸 呈 人 和 任何 人 即 打 棒 康 又 蝎 足 妹 ， 因 上 邮 P( 樟 


球门 是 球 ) = 0. 


捧 谋 事件 、 篮 妹 事 件 和 足球 事件 是 穷 举 鬼 ， 它 们 共同 填 满 了 整个 措 率 空间 ， 
因此 P( 棒 奸 U 足 妹 U 仍 妹 ) = 1; 


间 。 A 和 A 是 百 斥 的 还 是 穷 举 的 ? 


答 : 其 实 两 样 都 是 。A 和 A' 不 可 
能 有 任何 共同 要 素 ， 因 此 二 者 互 
斥 ; 著 将 二 者 相 加 ， 则 形成 整个 概 
率 空间 ， 因 此 二 者 穷 举 。 
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世上 没有 做 问题 


韶 : pa n 6) + P(A n B) 不 就 是 
P(A}) 的 复杂 化 表示 方法 吗 ? 


; 是 啊 正 是 如 此 。 不 过 有 
时 候 ， 想 出 不 同 的 方法 表示 同样 的 
概率 长 有 用 的 。 你 并 不 总 是 能 得 到 
希望 得 到 的 信息 ， 因 此 ， 改 变 一 下 
思维 方式 绝对 是 一 个 优势 。 


阅 ;相交 事件 的 数量 是 否 受到 限制 ? 


签 : 并 无 限制 。 几 个 事件 的 交集 
可 以 多 用 几 个 门 特 号 表示 。 例 如 ， 事 
件 A、B、C 的 交集 用 AmBmC 表 示 。 


有 时 候 ， 求 凡 个 交集 的 概率 很 是 棘 
手 ， 若 遇 到 麻烦 ， 建 议 画 一 幅 锥 思 
图 ， 并 认真 、 专 注 地 查看 要 将 哪 几 
个 概率 加 起 来 ， 以 及 要 将 哪 岂 个 概 
素 减 去 。 


把 握 机 会 


又 一 次 倒 老 的 转动 …… 


我 们 已 知 小 球 停 在 黑色 或 偶数 球 位 上 的 概率 为 0.684， 可 倒霉 的 
是 ， 小 球 停 在 了 23 位 一 红色 ， 奇 数 


不 过 另 一 局 又 要 开场 了 
即使 是 我 们 喜欢 的 奇数 也 不 能 给 我 们 带 来 轮 盘 财 上 的 好 运 。 庄 家 决定 


发 发 善心 ， 给 我 们 一 点 点 内 幕 消息 。 她 将 在 转动 轮 盘 后 给 我 们 一 条 有 
关 小 球 停留 位 置 的 线索 ， 而 我 们 呢 ， 将 根据 她 的 线索 算出 概率 














这 是 你 的 下 一 个 赌 
注 …… 还 有 关于 小 于 
停留 位 置 的 一 条 线索 . 
踊 ， 别 告诉 我 老 极 …… 








我 们 要 赌 这 个 结果 吗 ? 

假如 我 们 已 知 小 球 停 在 黑色 球 位 上 一 一 而 上 一 局 
则 是 小 球 会 停 在 黑色 或 奇数 上 ， 那么 结果 为 偶数 
的 概率 如 何 ? 让 我 们 算 一 算 
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认识 条 件 往 寨 


设 定 杀 伯 


庄家 说 小 球 停 在 黑色 球 位 ， 那 么 小 球 同时 停 在 偶数 
球 位 的 概率 是 多 少 ? 
















可 我 们 已 经 算 过 了 啊 ， 就 是 
停 球 结果 为 星 色 和 讽 数 的 概 
举 器 . 


问题 略 有 区 别 

我 们 要 算 的 不 是 “ 停 球 结果 为 黑色 与 偶数 ”相对 于 “全 
部 可 能 停 球 位 置 ”的 概率 ， 而 是 在 “已 知 停 球 位 置 为 黑 
色 ” 的 情况 下 ， 求 “ 球 位 为 俐 数 ” 的 概率 。 





已 知 停 球 位 
置 为 黑色 . 要 节 在 峙 位 为 黑色 
换言之 ,我们 要 求 出 在 所 有 黑色 球 位 中 有 多少 偶数 球 的 情况 下 ， 缚 公 
后 4 1 娩 二 伪 娄 的 术 衬 ， 


位 。 在 18 个 黑色 球 位 中 ， 有 10 个 球 位 是 偶数 ， 所 以 : 
10 
P( 黑 色 已 知 条 件 下 的 偶数 ) = 一 


= 0.556 (保留 三 位 小 数 } 
结果 证 明 ， 即 使 得 到 了 内 幕 消息 ， 我 们 的 胜算 实际 上 还 是 较 
之 前 低 。 “黑色 已 知 条 件 下 的 偶数 ”的 概率 实际 上 小 于 “个 
球 位 置 为 黑色 或 偶数 ”的 概率 。 


不 过 ，0.556 这 个 概率 仍然 比 50% 的 胜算 更 大 ， 因 此 仍 是 一 个 
不 错 的 赌注 。 让 我 们 继续 。 
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求解 条 件 概 率 


怎么 归纳 这 一 类 问题 呢 ? 首先 ， 我 们 要 另 用 一 种 表示 法 表示 
ra 用 它 来 量度 与 其 他 事件 的 发 生 情 况 有 关 的 某 个 事件 
的 概率 
如 果 要 表示 以 另 一 个 事件 的 发 生 为 条 件 的 某 个 事件 的 发 生 概 
率 ， 我 们 就 用 “|” 符 号 表示 “已 知 条 件 ”， 于 是 ，“ 以 事件 B 
为 已 知 条 件 的 事件 A 的 概率 ” WAN 


,经 点 生 的 
P(A1B) 和 、 条 件 - F pr 
现在 要 用 一 种 通用 方法 来 计算 P(A|B)。 我 们 感 兴趣 的 是 A 和 B 


同时 发 生 的 次 数 与 B 发 生 的 所 有 次 数 相 除 的 结果 。 观察 维 恩 图 ， 


得 到 : 
P(A N B) 


P(A|B)=— 本 


P(B) 


我 们 将 算式 改变 一 下 ， 以 便 得 出 求 P(IA_m B) 的 方法 : 
P(A MN B) = P(A | B) x P(B) 


这 还 不 是 最 终结 果 ，P(A 站 B) 的 另 一 种 表示 方法 是 P(BNMA)， 即 
我 们 可 以 将 算式 写成 : 


P(B NM A) = P(B | A) x P(A) 


也 就 是 将 A 和 B 对 调 一 下 。 


似乎 用 维 恩 图 表示 条 件 概率 很 有 难度 ， 
我 在 想 是 不是 有 其 他 办 法 。 


我 叫 “ 已 知 
条 件 ” 
9 
D 
由 于 我 们 试图 刷 出 “以 下 芍 杂 


件 的 A 的 概率 ”， 困 比 台 对 有 
EE 出现 殉 事 件 集合 感 尖 起 ， 








维 恩 图 并 不 总 是 表示 条 件 概率 的 最 好 方法 。 
别 担心 ， 还 可 以 用 另 一 种 图 一 概率 树 。 
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概率 树 


几 概 率 树 表示 条 件 概 字 


用 维 恩 图 表示 条 件 概率 并 不 总 是 那么 方便 ， 但 还 有 另 一 种 
图 形 ， 倒 是 能 得 心 应 手 地 处 理 条 件 概率 ， 这 就 是 概率 树 。 


下 面 是 关于 轮 盘 问题 的 一 幅 概 率 树 ， 其 中 标 有 以 几 种 颜色 







的 球 位 以 及 奇 候 球 位 为 结果 的 概率 。 
本 
扩 浊 之 各 颖 和 
这 是 弟 一 舱 五 斤 各 件 、 时 
频 色 区 所 每 个 事件 的 撤 \ 8/18 
1 410/18 
10/18 
这 此 是 分 支线 ， 就 > 
售 桂 上 的 树 技 一 去 . 红 
~> 8/18 
172 
绿 
1/2 
P{oo0 1 息 ) 


第 一 级 分 支线 上 标 出 各 种 结果 的 概率 ， 因 此 “ 停 球 结 
果 为 黑 ” 的 概率 为 18/38， 即 0.474; 第 二 级 分 支线 上 标 
出 已 知 所 连接 的 上 一 级 结果 的 情况 下 的 第 二 级 结果 的 概 
率 。 若 已 知 停 球 位 置 为 黑色 ， 则 停 球 位 置 为 奇数 的 概率 
为 8118， 即 0.444。 
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把 握 机 会 


利用 概率 树 还 能 计算 条 件 概 享 
概率 树 不 仅 能 帮助 你 以 图 形 方式 表示 概率 ， 还 能 帮助 你 计算 概率 。 


让 我 们 先 从 总 体 上 羞 看 概率 树 如 何 做 到 这 一 点 。 下 面 又 是 一 幅 概 率 
树 ， 其 分 支 数目 与 前 面 的 例子 中 的 分 支教 目 不 一 样 。 它 显示 了 两 级 
事件 : A 和 A' 以 及 B 和 B'。A’ 表 示 AA 中 不 涵盖 的 任何 可 能 事件 ，B' 表 示 
B 中 不 涵盖 的 任何 可 能 事件 。 


将 一 个 概率 乘 以 下 一 级 分 支 概率 ， 就 可 以 求 出 包含 相交 情况 的 概率 。 

例如 ， 假 定 要 求 P(AMB)， 可 以 用 P(B) 乘 以 P(A | B)， 即 ， 用 第 一 级 的 

B 分 支 概率 乘 以 第 二 级 的 A 分 支 概率 。 

这 是 你 先 前 看 到 这 的 同一 等 
头 一 只 要 将 连接 在 一 起 的 
上 下 级 分 支 的 概率 要 条 就 可 






为 了 市 PA 人 ND)， 要， 9 
出 条 分 支线 上 鬼 投 ee 网 
B 
P(By P(A 1B A  PAnB 印 =P(A1B) x P(B) 
| 
发 外 事件 区 反 
P(A | B') A' P(A! n B') = P(A | B') x P(B') 
已 知 条 件 为 忆 不 
发 生 ， 此 时 也 发 
生 事 件 A 的 概率 ， 


使 用 概率 树 得 出 的 结果 和 以 前 的 算法 相同 ， 用 不 用 随便 你 。 画 概率 
树 很 费时 间 ， 但 它 是 一 种 以 图 形体 现 条 件 概率 的 途径 。 
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概率 磁 贴 


邓 闪 圈 饼 店 正 在 调查 客户 购买 油 炸 圈 饼 和 咖啡 的 概率 。 他 们 画 了 一 幅 概 率 
树 ， 用 磁 贴 标 上 了 各 种 概率 。 突 然 一 阵 怪 风 刊 来 ， 概 率 磁 贴 转眼 不 知 所 踪 。 
你 的 任务 就 是 将 各 个 概率 磁 贴 放 回 概率 树 。 下 面 是 一 些 线索 。 





P( 辆 饼 ) = 3/4 P( 咖 啡 | 狠 饼 ') = 1/3 P( 图 饼 mn 咖啡 ) = 9/20 
贿 啡 
国 饼 
期 啡 ， 
凌晨 
国 饼 ' 
阮 旱 ' 


EE 
DD | 
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把 握 机 会 


梳 洽 料 借用 诀 闫 


1 .分 出 层 驱 


努力 分 出 需要 计算 的 概率 的 不 同 层级 。 例 如 ， 如 果 给 定 的 条 件 概 率 
为 P(A | B)， 则 可 能 需要 在 第 一 级 中 涵盖 B， 在 第 二 级 中 涵盖 A。 


2. 烧 和 写 已 知 伪 息 
如 果 已 知 部 分 概率 ， 则 将 这 些 概率 写 和 概率 树 上 的 相应 位 置 。 


3. 泥 位 : 每 一 免 分 夫 的 模 洗 总 和 为 ) 


如 果 将 从 同一 个 点 上 衍生 出 来 的 所 有 分 支 的 概率 加 起 来 ， 总 和 
应 该 等 于 1。 记 住 : P(A) = 1 - P(A)。 


4. 记 住 公式 
通过 下 列 计算 式 可 求 出 大 多 数 其 他 概率 : 
p(A | B) = P(A NM B) 
P(B) 
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概率 磁 贴 解答 


概率 磁 贴 解答 


邓肯 圈 饼 店 正 在 调查 客户 购买 油 炸 轿 饼 和 咖啡 的 概率 。 他 们 画 了 一 幅 概率 
树 ， 用 磁 贴 标 上 了 各 种 概率 。 突 然 一 阵 怪 风 乔 来， 概率 磁 贴 转眼 不 知 所 踪 。 
你 的 任务 就 是 将 各 个 概率 磁 贴 放 回 概率 树 。 下 面 是 一 些 线索 。 


P( 圈 饼 ) = 3/4 P( 咖 啡 | 圈 饼 ') = 1/3 P( 圈 饼 m 咖啡 ) = 9/20 


P( 各 啡 | 图 饼 ) “(中 啉 间 圈 鲜 ) 


F( 转 人 饼 ) 
_ 9/20 


3/4 





= 3/5 3/5 咖啡 
相 加 之 和 人 频 为 1。 
圈 饼 
2/5 咖啡 ! 
相 加 之 和 须 为 1 
1/3 咖啡 
圈 饼 ' 相 加 之 和 地 须 为， 
2/3 咖啡 ， 
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把 握 机 会 


邓肯 了 局 饼 店 的 工作 还 没有 彻底 完成 ! 既然 已 经 填 好 了 概率 树 ， 请 用 概率 树 





绑 习 计算 一 些 概 率 。 
1. P( 图 饼 ') 2. P( 轿 饼 ' m 呀 啡 
3. P( 咖 啡 ' | 图 饼 ) 4. P( 咖 啡 ) 和、 提示 ， 买 咖 喇 的 方式 有 败 种 ? 


(你 可 以 娆 买 回 喇 又 买 国 饼 ， 
也 可 以 只 实 咖 呈 不 买 图 钱 ) 


和 ， 直 诗作 的 某 学 答 
ec 一 慕 饮 给 兴 带 亲 加 助 。 
5. P( 量 饼 | 哪里) 
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练习 解答 






你 的 任务 是 用 填写 完毕 的 概率 树 算 出 某 些 概率 。 


詹 习 
解答 
1. P( 图 饼 ') 2. P( 轿 饼 " 六 咖啡 ) 
174 1/12 


外、 概率 树 上 可 惧 读 出 这 个 数 ， 





EA 用 P( 图 饼 ) 针 ,2P( 加 咪 | 国 销 可 以 


我 们 已 经 知道 得 出 这 个 数 。 我 们 刚才 已 经 刺 出 
P( 国 饼 ) = 374， P( 图 销 ) = 1/4. 再 从 挤 率 树 上 看 出 
并 肯定 是 1/4 P{ 史 只 | 图 人 饼 ) = 1773， 
因此 P( 图 铺 ) 二 者 相 村 即 短 1712， 
3. P( 咖 啡 ' | 圈 饼 ) . P{ 咖 啡 》 
275 € 8/15 
我 们 可 以 从 概率 ~ 
上 3 ,, 
树 上 读 出 这 个 数 ， 这 个 概率 有 此 持 手 ， 要 是 还 
设 有 商 出 来 也 不 要 担心 ， 
为 了 囊 出 P( 咖 啡 ) ， 我 们 需要 将 
(加 啡 几 国 饼 ) 和 P( 吕 咪 扑 国 鲜 
加 起 来 ， 即 ， 125712 十 9420 = 8715， 
5. P( 轿 饼 | 咖啡 ) 


27/32 SS 


要 囊 这 个 概 芋 .必须 先 未 出 P{ 品 咪 ) 
P( 图 银 | 加 啡 ) = P( 轩 匀 门 加 咪 )P( 加 只 ) ， 


即 ，(9/z0) / {8 7 15) 一 27732。 
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网 :我 仍然 不 清楚 PUAn 8) 和 
P{A|B) 的 差别 。 


答 : P(ANB) 是 A 和 B 同 时 发 生 
的 概率 。 根 据 这 个 概率 无 法 假设 其 
中 一 个 事件 是 否 已 经 发 生 。 必 须 在 
不 作 任 何 假设 的 情况 下 ， 求 出 两 种 
事件 的 发 生 概率 。 


P(A|B) 是 以 事件 B 为 条 件 ， 求 事件 A 
的 发 生 概论 。 也 就 是 说 ,你 假定 事 
件 B 已 经 发 生 ， 然 后 根据 这 个 假设 算 
出 事件 A 的 发 生 概率 。 


问 : 这 么 说 P{A|B) 和 P(A} 是 一 
样 的 呈 ? 


答 : 不 对 ， 二 者 代表 不 同 的 摄 
率 。 在 计算 P(A|B)} 的 时 候 ， 必 须 假 
设 事件 B 已 经 发 生 ; 而 在 计算 P(A) 
的 时 候 ， 可 以 不 作 此 类 假设 。 


P(A |B) = 


重 受 统计 量 
条 件 


P(A NN\ B) 


P(E) 


世上 没有 俐 问题 


阅 : ptA1B) 和 plB1A) 一 样 吗 ? 看 
上 去 插 相 似 三 。 


答 : 这 是 个 常见 错误 ， 可 
实际 上 它们 是 完全 不 一 祥 的 概 
率 。P(A|B) 是 假定 B 已 经 发 生 ， 在 
此 情况 下 A 的 发 生 概率 ; P(B|A) 是 
假定 A 已 经 发 生 ， 在 此 情况 下 B 的 发 
生 概 率 。 二 者 所 求 的 是 不 同 已 知 条 
件 下 的 不 同事 件 的 概率 。 


阅 : 概率 树 比 维 恩 图 更 好 用 吗 ? 


答 : 两 种 图 形 部 是 以 图 形 表 示 
概率 的 途径 ， 各 有 其 妙 处 。 维 思 图 
的 用 处 在 于 能 指出 基本 概率 及 各 种 
关系 ; 概率 树 的 用 处 则 在 于 条 件 概 
率 的 计算 。 具 体 使 用 哪 种 图 形 取决 
于 你 要 解决 的 问题 。 


把 握 机 会 


| 奖 : 概率 树 上 的 分 支 有 层级 数目 
限制 吗 ? 


签 : 理论 上 没有 限制 。 你 可 能 会 
在 实践 中 发 现 ， 超 大 型 概率 树 十 分 
难以 贺 豚 ， 但 尽管 如 此 ， 你 还 是 会 
感到 驾驭 超大 型 概率 树 比 脱离 概率 
树 进行 此 复 计算 来 得 容易 。 


问 : ”如 果 A 与 6 瑟 斥 ,那么 P(A | B) 
结果 如 何 ? 


答 : 如果 A 与 B 互 斥 ， 则 P(AN 
B)=0 且 P(A1B)=0。 这 可 以 理解 ， 因 
为 当 A 与 B 互 斥 时 ， 两 个 事件 不 可 能 
同时 发 生 。 如 果 我 们 假定 事件 B 已 
经 发 生 ， 则 事件 A 不 可 能 发 生 ， 因 
此 P(A|B) = 0。 
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一 个 新 的 条 件 概率 


真 倒霉 ! 


在 知道 小 球 会 停 在 黑色 球 位 上 后 ， 你 下 了 一 注 ， 赌 小 球 会 停 
在 偶数 球 位 上 。 真 倒 竹 ， 小 球 停 在 了 17 上 一 你 又 输 掉 了 一 
些 筹码 


也 许 我 们 可 以 再 来 一 局 ， 赢 回 一 些 筹 码 。 这 一 次 ， 庄 家 说 小 
球 会 停 在 偶数 球 位 上 一 这 个 球 位 同时 为 黑色 的 概率 是 多 少 ? 


-局 相 及 ， 








情况 和 前 一 








可 这 个 问题 和 前 面 鬼 问题 很 相似 ， 你 
是 说 我 们 要 再 画 一 幅 概 率 树 ， 然 后 算出 
一 系列 新 概率 吗 ? 就 未 印 用 原先 那 幅 概 
率 树 吗 ? 


可 以 再 次 使 用 已 经 用 过 的 算式 。 
上 一 个 任务 是 算出 P( 偶 | 黑 )， 我 们 可 以 利用 为 了 解决 上 
问题 而 算出 的 概率 来 计算 P( 黑 | 偶 )。 下 面 是 我 们 前 面 用 过 的 
概率 树 : 
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8/18 


10/18 


10/18 


1/2 


-个 





把 所 机 会 


利 半 已 有 概率 求 风景 [ 偶 } 


那么 如 何 求 P( 黑 | 偶 )? 即使 无 法 从 概率 树 上 直接 看 出 这 个 概率 ， 也 还 
有 办 法 通过 已 知 概 率 算出 这 个 概率 。 我 们 所 需要 做 的 是 查看 已 知 概 
率 ， 然 后 设法 用 这 些 已 知 概率 算出 我 们 还 不 知道 的 概率 。 


让 我 们 先 分 析 要 求 的 最 终 概率 。 利用 已 有 的 概率 ， 
aa 
利用 求 条 件 概 率 的 公式 ， 得 出 : 求 出 需要 的 概率 。 
一 一 
P( 因 修仙 } 
P( 昭 | 偶 ) = 一 一 一 一 
P( 偶 ) 


只 要 能 求 出 P( 黑 首 偶 ) 和 P( 偶 ) 的 概率 ， 就 能 将 这 些 概率 代入 公式 ， 算 
出 P( 黑 | 偶 )。 我 们 需要 适 过 一 些 过 程 求 出 这 些 概 率 。 


觉得 有 困难 ? 别 担心 ， 我 们 会 指导 你 完成 这 个 计算 。 


第 1 步 : 求 岂 黑 门 偶 ) 


让 我 们 先 算 公式 的 第 一 部 分 : P( 黑 门 偶 )。 


必 艺 邓 蔡 









查看 上 一 页 的 概率 树 ， 如 何 通过 概率 树 求 出 P( 黑 几 偶 )? 





Ms. PP( 黑 站 仿 ) = 己 ( 偶 门 村) 
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~ 


将 P( 黑 ) 与 P( 如 | 黑 ) 相 乘 ， 可 求 出 P( 是 间 姐 )}， 部 
P( 黑 门 偶 ) = 下 ( 星 ) xP( 偶 | 里 ) 






查看 背面 的 概率 树 ， 如 何 利用 它 算出 P( 黑 羽 偶 )? 









我 们 得 到 了 什么 ? 


我 们 希望 求 出 P{ 黑 | 偶 ) 的 概率 ， 为 此 先 求 : 


P( 时 偶 ) >， 9) 六 两 个 重 相等 
P( 偶 ) 

到 现在 为 止 ， 我 们 还 只 是 涉及 了 公式 的 第 一 部 分 : 
P( 黑 门 偶 )， 而 你 已 经 了 解 如 下 算法 : 

P( 黑 站 偶 ) = P( 黑 ) x P( 旭 | 昧 ) 
由 此 可 得 出 

P( 黑 ) x_P( 偶 | 时) 
P( 黑 | 偶 ) = 一 一 一 一 一 
( 黑 | 偶 ) P(N) 
下 一 步 我 们 求 P{ 偶 )。 于 是 ， 起 们 可 ,以 用 P( 黑 ) < 了 P( 偶 | 时 ) 
代替 原 公 式 中 欧 P( 旺 门 费 )。 


说 名 过 脐 


再 看 看 166 页 的 机 率 树 ， 你 觉得 我 们 该 如 何 利 用 概率 树 求 出 P( 偶 )? 
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第 2Z 步 : 求 几 偶 } 


接 下 来 求 小 球 停 在 偶数 球 位 的 概率 ， 我 们 可 以 想 想 发 生 这 种 结果 的 
所 有 方式 ， 据 此 求解 。 


小 球 停 在 偶数 球 位 上 的 情况 包括 : 球 位 既是 黑色 又 是 偶数 ， 或 者 球 位 
既是 红色 又 是 偶数 。 这 两 种 情况 就 是 小 球 停 在 偶数 球 位 上 的 方式 。 


这 表示 我 们 可 以 将 P( 黑 个 ) 与 P( 红 站 偶 ) 相 加 ， 得 出 P( 偶 )。 也 就 是 
是 说 ， 我 们 将 “既是 黑色 又 是 偶数 的 球 位 ”的 福 率 与 “既是 红色 又 
是 偶数 的 球 位 ”的 概率 相 加 。 概 率 树 上 的 相应 分 支 以 黑色 实 线 突 出 
标示 。 


把 握 机 会 


8/18  _ 棵 
偶 
Re 将 这 尝 概 齐 相 加 。 
一 亲 未 出 小 斑 传 在 偶 
i 数 球 位 的 杠 弟 。 
侦 
—0 
一 00 


得 出 : 





EE 10 中 8 


38 WW 8 庆 这 学 概率 取 自 
概率 树 ， 


第 4 章 概率 计算 


169 


地 推 条 件 概率 的 推广 
步骤 和 ， 求 所 时 | 偶 ) 
你 还 记得 最 初 的 问题 吗 ?我们 兽 想 求 P( 黑 | 偶 )。 其 中 : 


P( 岂 六 乌 ) 
P( 合 ) 





P( 黑 | 俩 ) = 


一 开始 求 的 是 P( 黑 站 偶 ): 
P( 黑 全 个 ) = P( 早 ) x P( 侦 | 里) 


接着 求 出 P( 偶 ) 的 表达 式 : 
P( 偶 ) = P( 黑 ) x P( 偶 | 黑 ) + P( 红 ) x P( 偶 | 红 ) 


将 这 些 式 子 合并 就 可 以 利用 概率 树 上 的 概率 值 计 算 P( 黑 | 偶 ): 我 们 刚 方 用 要 素 树 
算 过 过 个 结 昧 ， 


P Nn 

Pp( 黑 | 偶 ) -了 于 人 
P( 偶 ) 

_ P( 黑 ) x P( 偶 | 黑 ) 
P( 黑 ) x P( 偶 | 黑 ) + P( 红 ) x P( 偶 | 红 ) 
5 9 


Se - 所 以 可 
: 和 发 们 之 区 计算 这 ， 
19 19 《~ 人 、 侈 入 载 公 曲名 信 结 累 。 


这 说 明 我 们 现在 找到 了 利用 已 知 概率 求解 新 条 件 概率 的 方法 一 这 
就 能 帮助 我 们 解决 更 多 错综复杂 的 概率 问题 了 。 


让 我 们 看 看 如 何 推 而 广 之 。 


170 深入 浅 出 统计 学 


上 一 页 的 结果 可 以 推广 到 其 他 问题 


假想 你 有 一 幅 概 率 树 ， 上 面 显示 了 事件 A 和 事件 B 的 概率 ， 假 定 
已 知 每 个 分 支 的 概率 如 下 : 


P(B1A) 8 






wy P(B'IA 


这 此 分支 娆 去 不 又 穷 浊 -1 


1 B 
Be PB IA) 


A' 
P(B' | AD 


现在 ,假设 你 要 求 P(A|B8)，、 并 且 知 道上 面 的 概率 树 上 所 显示 的 
信息 。 请 问 如 何 使 用 已 知 概率 求 出 P(A|B)? 


我 们 可 以 从 以 前 算 过 的 公式 开始 : eo. 
, 频 癌 中 这 网 个 ， 
PIAmB 芒 们 必须 
P(A | 本 < 一 才能 可 出 PUA 1E)。 
P(B) 
现在 ， 可 以 用 概率 树 上 的 概率 求 出 P(A 门 B) ， 换 句 话 说， 我 们 可 
以 使 用 下 式 计 算 P(AmmB): 


P(ANMNB)}=P(A) x P(B|A) 


但 如 何 求 P(B) 呢 ? 


部 舞动 能 


好 好 观察 概率 树 上 的 构 率 。 如 何 利用 这 些 概 率 求 出 P(B)? 
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全 概率 公式 


利用 全 概率 公式 求 例 FLB) 


让 我 们 使 用 之 前 求解 以 偶 ) 的 相同 步 又 求解 P(B)。 我 们 需要 将 想得到 的 事件 
的 所 有 可 能 发 生 方式 的 概率 相 加 。 


事件 B 有 两 种 发 生 方式 : 与 事件 A 一 起 发 生 ; 不 与 事件 A 一 起 发 生 。 即 可 以 


利用 下 式 求 出 P(B)}: 
把 这 两 个 刍 集 桐 加 ， 


P(B) = P(A NM B)+ P(A'NM B) 所 一 一 一 手册 P(E). 


我 们 可 以 根据 从 概率 树 上 得 知 的 概率 ， 重 写 这 个 式 子 : 
P(A NM B) = P(A) x P(B | A) 
P(A!' NM B) = P(A') x P(B | AD 


得 出 : 
P{B) = P(A) x P{B | A) + P(A') x P(B | AN 


这 个 公式 有 时 被 称 为 全 概率 公式 ， 因 为 它 提供 了 一 种 方法 : 根据 条 件 概 


率 计算 一 个 特定 事件 的 全 概率 。 
A 


~ 


P(B'J1A) 一 B 求 出 PCe) 。 


区 站 PB 1A) 
A' 


~——_— 


PB'IA) ~B 


P(A) 


既然 已 经 求 出 P(A mn B) 与 P(B) 的 表达 式 ， 就 可 以 将 这 两 个 式 子 
放 在 一 起 ， 得 出 P(A | B) 的 表达 式 。 
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认识 贝 叶 斯 定理 


首先 ， 我 们 想 从 概率 树 上 已 知 的 概率 求 出 P(A|B)， 我们 已 知 

P(A)， 且 已 知 P(B|A) 和 和 现在 所 需要 的 是 一 个 求解 条 若是 看 着 觉得 复杂 ， 别 : 
i i 2 运算 。 

件 概率 的 通用 表达 式 ， 该 公式 是 已 知 条 件 即 P(A|B) 的 逆 运 算 。 担心 ， 它 计算 复杂 结果 


我 们 先 算 : : 的 能 力也 一 样 强 。 尽 管 公式 棘手 我 们 却 
妆 过 代 接 。 : 能 借助 图 形 得 到 帮助 。 : 


中 最 难 掌 握 的 部 分 之 一 





P(A M B) 
P(B) 





P(A | B) = 






我 们 在 127 页 求 出 P(ANB)=P(A)xP(B|A)， 
P(B) = P(A) x P(B|IA) + P(A') x P(B|IA'), 


又 在 前 一 页 求 出 


将 以 上 两 个 结果 代入 公式 ,得 出 : 
P(A) x P(B | A) 


PATB = 一 一 一 一 一 一 一 一 一 一 i 
P(A) x P(B |A)+ P(A') x P(B|A!') 这 个 公众。 


这 就 是 所 谓 的 贝 叶 斯 定理 。 该 定理 提供 了 一 种 计算 逆 条 件 概率 的 方 
法 ， 在 你 无 法 预知 每 种 概率 的 情况 下 ， 它 十 分 有 用 。 


ae 这 个 分 支 
a 换 概 这 pee 
= 
已 知 A4， 要 求 J ee 除 以 这 两 个 
P(A | en oy p(B IA~ ~B 分 支 的 概率 之 和 ， 
| B 
pay PB 1A) 
AI 


= 


和 
P(BIIAT ~B' 
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加 强 练习 





加 强 绒 习 


芒 巷 游戏 公司 正在 测试 两 种 新 游戏 ， 他 们 邀请 一 群 志愿 者 选择 自己 最 喜欢 玩 的 游戏 ， 玩 好 
以 后 告诉 芒 芒 公司 对 游戏 的 满意 程度 。 


80% 的 志愿 者 选择 了 游戏 1，20% 的 志愿 者 选择 了 游戏 2 。 在 游戏 1 玩家 中 ， 有 60% 的 人 
觉得 好 玩 ，40% 觉 得 不 好 玩 。 而 游戏 2 玩家 中 有 70% 的 人 觉得 好 玩 ，30% 的 觉得 不 好 玩 。 


你 的 第 一 个 任务 就 是 填写 这 一 例子 的 概率 树 。 
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把 握 机 会 


臣 芒 公司 随机 挑选 了 一 名 志愿 者 ， 问 她 游戏 是 否 好 玩 ， 她 说 好 玩 。 这 仪 志愿 者 觉得 她 所 玩 的 这 款 游戏 
好 玩 时 ， 她 玩 游戏 2 的 概率 有 多 大 ? 请 使 用 贝 叶 斯 定理 。 


人 


革 人 克 论 玩 叫 种 洲 戏 部 感 到 满意 克 要 率 有 光大 ? 
只 要 想 通 这 坎 个 问题 ， 就 能 用 贝 叶 斯 定 音 书 出 正确 蜀 答 娄 . 
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强化 练习 解答 

pg 

芒 芒 游戏 公司 正在 测试 两 种 新 游戏 ， 他 们 邀请 一 群 志愿 者 选择 自己 最 喜欢 玩 的 游戏 ， 玩 好 
以 后 告诉 芒 芒 公司 对 游戏 的 满意 程度 。 


80% 的 志愿 者 选择 了 游戏 1，20% 的 志 应 者 选择 了 游戏 2。 在 游戏 1 玩家 中 ， 有 60% 的 人 
觉得 好 玩 ，40% 觉 得 不 好 玩 。 而 游戏 2 玩家 中 有 70% 的 人 觉得 好 玩 ，30% 的 觉得 不 好 玩 。 


你 的 第 一 个 任务 就 是 填写 这 一 例子 的 概率 树 。 






发 们 运 知道 每 一 位 殉 容 对 所 选择 的 
我 们 知道 大 位 现 家 选择 系 种 联 戏 的 概率 沪 式 巧 到 满意 或 不 满意 的 抽 率 . 
因此 可 以 用 这 举报 率 画 出 第 一 级 分 支 ， 


0.8 


0.4 系 满意 


0.2 0.7 满意 
游戏 2 Se 


0.3 不 满意 
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把 握 机 会 























芒 芳 公司 随机 挑选 了 一 名 志愿 者 ， 问 她 游戏 是 否 好玩 ， 她 说 好 玩 。 这 位 志愿 者 觉得 她 所 玩 的 这 款 游戏 好 玩 时 ， 
她 玩 游戏 2 的 概率 有 多 大 ? 请 使 用 贝 叶 斯 定理 。 


我 们 要 用 贝 叶 斯 定理 刷 出 P{ 陪 戏 2 | 满意 ) 。 公 式 娩 下， 
P{ 洲 戏 2) P( 庙 意 | 洲 式 2) 
P( 吝 戏 z | 满意 ) = 一 
P( 岁 戏 2) P( 湛 意 | 陛 戏 2) + P( 游 戏 1) P( 满 意 | 游戏 让 
让 我 们 从 P( 游 戏 2) (注意 | 网 戏 2) 算 起 


我 们 已 经 知道 P( 尖 戏 2) = 0.2 且 P( 满 意 | 禹 戏 2) = 0.7， 即 : 
P{ 了 游戏 2) P( 满 意 | 器 戏 2) = 0.2 x 0.7 


= 0.14 


接 下 来 需要 囊 P( 卫 懂 1) P( 满 意 | 雍 戏 1 ， 我 们 已 经 知道 P( 满 意 | 陷 戏 1) = 0.6 以 肥 P( 洲 戏 1) = 0.8。 即 ， 
P( 洲 戏 站 P( 满 意 | 锣 戏 1) = 0.6 x 0.8 


一 0.48 


将 上 并 代入 贝 叶 斯 定 娃 公式 ， 得 ， 
P{( 吝 戏 2) P( 满 意 | 潞 戏 2) 
P( 洋 戏 2) P( 满 意 | 血 戏 ?2) 十 PP( 洲 戏 人 PP( 满 意 | 洲 戏 人 7) 


0.14 


P( 备 戏 2| 满 意 ) = 


0.14 十 0.48 


0.14 


0.62 


0.226 
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重 刘 统计 最 


辐 重 要 统计 量 
号 全 概率 公式 
心 果 有 两 个 事件 A 和 世 ， 则 : 
P(E) =F 公 门 A) +Pe NA) 
=P(A) P(E | A)} + P(AN) PE | A) 
全 概率 公式 是 贝 叶 斯 完 理 的 分母 













避 果 你 有 个 互 折 且 穷 举 的 事件 ，A: 至 A， 
而 是 另 一 个 事件 ， 风 : 





P(A) PE | A) 
PA PIA) PE | A +P(AI) P(E | a 信 ) 


178 深入浅出 统计 学 


问 : ”什么 时 候 使 用 贝 叶 斯 定理 呢 ? 


答 : 在 需要 求 出 条 件 概率 ， 且 该 
条 件 概率 与 已 知 条 件 概率 顺序 相反 时 
使 用 。 


| 问 :我 必须 画 概率 树 吗 ? 


答 : 
也 可 以 使 用 概率 树 进行 辅助 。 使 用 贝 
叶 斯 定理 更 为 直接 快捷 ， 但 务必 记 
住 各 个 概率 。 在 你 忘记 贝 叶 斯 定理 
时 ， 概 率 树 很 有 用 ， 不 仅 可 以 让 你 
得 出 相同 的 结果 ， 还 能 让 你 免 于 忘 
记 每 个 事件 所 对 应 的 概率 。 


赢 钱 了 ! 


恭喜 恭喜 ! 这 次 小 球 停 在 10 号 球 位 上 一 黑色 兼 偶数 。 你 


赢 回 了 一 些 筹码 。 





你 可 以 直接 使 用 贝 叶 斯 定理 ， 


世上 没有 俐 问题 


问 :在 轮 盘 财 问题 中 ， 当 我 们 计 
算 p( 黑 | 偶 ) 时 ， 并 没有 将 小 球 停 在 绿 
色 球 位 的 任何 概率 计算 进去 。 我 们 弄 
错 了 吗 ? 


从 : 不 ， 没 有 弄 错 。 轮 盘 上 仅 
有 的 两 个 绿色 球 位 是 0 和 00， 我 们 并 
不 将 这 两 个 数字 计 入 偶数 。 也 就 是 
说 ，P( 偶 | 绿 ) 等 于 0， 因 此 ， 这 对 计 
算 结果 没有 影响 。 


问 : ”经 计算 ， 概率 Pp( 黑 | 偶 ) 与 P( 偶 | 
黑 ) 相 等 : 都 是 5/9。 总 是 这 样 吗 ? 


答 : 的 确 ， 这 里 的 P( 黑 | 偶 ) 和 
P( 偶 | 黑 ) 是 一 样 的 ， 但 这 并 不 表示 其 
他 情况 也 是 如 此 。 


把 握 机 会 


如 果 你 有 两 个 事件 : A 和 B， 不 能 假定 
P(A | B) 和 P(B | A) 会 得 出 相同 的 结果 。 
二 者 指 的 是 不 同 的 概率 ， 实 际 上 ， 作 
那样 的 假设 会 让 你 在 统计 学 考试 中 
丢掉 宝 责 的 分 数 。 你 需要 使 用 贝 叶 
斯 定理 ， 确 保 得 出 正确 的 答案 。 


问 : 


用 吗 ? 


答 : 


贝 叶 斯 定理 在 现实 生活 中 有 


实际 上 非 党 有用。 例如， 在 


计算 机 科学 中 ， 可 以 用 它 过 滤 电 子 
邮件 及 检测 垃圾 邮件 ， 有 时 它 还 用 在 
医学 试验 中 。 
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独立 事件 


再 财 最 后 一 次 


在 你 撤离 轮 盘 赌 之 前 ， 庄 家 给 你 的 最 后 一 注 开 了 个 大 党 得 走运 吗 ? 
价钱 : 赢 三 倍 ， 或 赔 光 一 如果 你 赌 小 球 会 连续 两 次 
停 在 黑色 球 位 上 ， 有 可 能 赢 回 所 有 筹码 。 


下 面 是 概率 树 。 注 意 ，“ 连 续 两 次 停 在 两 个 黑色 球 位 
上 ”的 概率 与 166 页 上 求解 的 概率 有 点 儿 不 一 样 ， 在 
166 页 ， 我 们 试图 计算 在 已 知 球 位 为 黑色 的 条 件 下 ， 停 
球 结果 为 偶数 球 位 的 可 能 性 。 
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把 握 机 会 


如 果 几 个 事件 豆 有 影响 ， 则 为 相关 事件 


“小 球 前 后 两 次 停 在 黑色 球 位 上 ”的 概率 与 “小 球 停 在 已 知 
为 黑色 球 位 的 偶数 球 位 上 ”的 概率 略 有 区 别 。 请 看 下 面 的 
P( 偶 | 黑 ) = 10/18 = 0.556 
对 于 P( 偶 | 黑 ) 来 说 ，“ 停 在 偶数 球 位 ”的 概率 受到 “ 停 在 黑 
色 球 位 ”的 概率 的 影响 ， 我 们 知道 小 球 已 经 停 在 黑色 球 位 
上 ， 于 是 利用 这 一 点 计算 概率 : 我 们 查看 在 所 有 黑色 球 位 
中 ， 有 几 个 球 位 是 偶数 。 





如 果 我 们 不 知道 小 球 已 经 停 在 黑色 球 位 上 ， 则 概率 会 不 一 样 。 
为 了 计算 P( 偶 ): 我 们 查看 在 所 有 的 球 位 中 ， 有 几 个 球 位 是 偶数 。 


这 两 个 
P( 偶 ) = 18/38 = 0.474 se 信 梳 率 是 


丰 一 样 曲 


P( 偶 | 黑 ) 得 出 了 与 P( 偶 ) 不 一 样 的 结果 ， 换 句 话 说， 我 们 所 
得 知 的 “ 球 位 为 黑色 ”的 信息 使 概率 发 生 了 改变 。 我 们 说 
这 两 个 事件 是 相关 事件 。 

如 果 用 通用 术语 表达 就 是 : 如 果 P(A | B) 与 P(A) 不 等 ， 则 我 
们 说 事件 A 与 事件 B 是 相关 事件 一 这 等 于 说 事件 A 与 事件 B 
的 概率 相互 影响 。 










你 改变 了 一 切 ， 和 
你 在 一 起 我 变 得 不 
一 和 







再 看 一 看 前 一 页 的 概率 树 。 你 注意 到 每 一 级 分 支 的 特点 了 
吗 ? “小 球 在 第 一 局 中 停 在 黑色 球 位 上 ”和 “小 球 在 第 
二 局 中 停 在 黑色 球 位 上 ”是 相关 事件 吗 ? 为 什么 ? 


第 4 章 概率 计算 181 


独立 事件 


如 果 人 几 个 事件 互 不 影响 ， 则 为 独立 事件 
并 非 所 有 事件 都 是 相关 事件 ， 有 时 候 ， 几 个 事件 相互 之 间 完全 
没有 影响 ， 无 论 其 他 事件 发 生 与 否 ， 某 个 事件 的 发 生 概率 总 是 保 
持 不 变 。 例 如 ， 请 看 P( 黑 ) 和 P( 黑 | 黑 ) 的 概率 ， 你 注意 到 什么 了 ? 


这 学 概 府 相 等 ， 事 件 
P( 黑 )= 18/38 =0.474 全 一 一 一 一 一 一 各 件 相 羡 独立 ， 
P( 黑 | 黑 ) = 18/38 = 0.474 
以 上 两 个 概率 数值 相同 ， 换 句 话说 ，“ 小 球 在 这 一 局 停 在 黑色 球 


位 上 ”事件 对 “小 球 在 下 一 局 停 在 黑色 球 位 上 ”事件 没有 影响 ， 
这 两 个 事件 是 独立 的 。 


独立 事件 彼此 之 间 互 不 影响 一 不 以 任何 形式 相互 影响 对 方 的 概 
率 。 若 一 个 事件 发 生 ， 其 他 事件 的 概率 保持 原样 ， 纹 丝 不 变 。 










行 ， 你 对 我 也 毫 无 影 
响 。 我 才 系 管 你 存 系 存 
在 。 我 想 这 意味 着 我 们 相 
互 和 独立 ， 







你 以 为 我 关心 你 的 事 ? 那 和 


我 元 关 。 我 只 当 你 不 存在 。 





如 果 事 件 A 和 事件 B 相 互 独立 ， 则 事件 A 的 概率 不 受 事件 B 的 影响 ， 
换 句 话说 ， 对 于 独立 事件 来 说 : 


P(A | B) = P(A) 


我 们 还 能 用 以 上 公式 进行 独立 性 检验 。 如 果 你 有 两 个 事件 A 和 B， 
且 P(A | B) = P(A)， 则 事件 A 和 事件 B 必 然 相 互 独立 。 
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把 握 机 会 


再 谈 独 立 和 事件 概率 计 和 
独立 事件 的 其 他 概率 也 很 容易 计算 ， 例 如 P(A  B)。 


我 们 已 经 知道 如 果 AA、B 是 互 斥 事 忻 ， 











pA 则 二 者 不 会 是 独立 事 
; “′ 事件 , 则 二 者 不 会 是 互 
如 果 A 和 B 是 独立 事件 ， 则 P(A | B) 与 P(A) 相 同 。 即 对 于 独 :“ 扶 事 件 。 
人 ; 如 果 A 和 B 是 互 斥 事件 ， 即 如 果 事件 A 
: 发 生 ， 则 事件 B 不 发 生 。 这 意味 着 ，A 
P(B) : 的 结果 会 影响 B 的 结果 ， 于 是 这 二 者 
或 : 相关 。 
PA BPA IS) ; 与 此 相似 ， 如 果 A 和 B 是 独立 事件 ， 则 
换 名 话说， 如果 两 个 事件 相互 独立 ， 则 通过 将 两 个 事件 各 : 二 者 不 会 互 斥 。 


自 的 概率 相 稼 ， 可 以 算出 同时 发 生 这 两 件 事 的 概率 。 2 





现在 该 计算 另 一 个 概率 了 : 
的 概率 是 多 少 ? 


“小 球 连续 两 次 停 在 黑色 球 位 上 ” 


必 忆 吕 蔡 
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动 动笔 解答 


演 动 荡 
解答 












问 : 
差别 ? 


答 : 假想 你 有 两 个 事件 : A 和 
B。 如 有 果 A 和 B 互 乒 ， 则 在 事件 A 发 生 
时 ，B 无 法 发 生 。 同 样 ， 如 果 事 件 B 
发 生 、 则 下 无 法 发 生 。 撞 名 话说 ， 二 
者 不 可 能 同时 发 生 。 


如 果 A 和 B 是 独立 事件 ， 则 A 的 结果 
对 B 的 结果 没有 影响 ， 同 时 B 的 结果 
对 A 的 结果 没有 影响 。 二 者 各 自 的 结 
果 对 对 方 没有 影响 。 


独立 事件 和 互 斥 事 件 有 何 


阅 :两 个 事件 必须 同时 为 独立 事 
件 吗 ? 能 不 能 其 中 一 个 事件 是 独立 事 
件 ， 而 另 一 个 事件 是 相关 事件 ? 


答 : 不 能 ， 两 个 独立 事件 指 的 


是 “相互 ”独立 ， 因 此 不 可 能 一 个 
是 相关 事件 ， 另 一 个 是 独立 事件 。 
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= 0.224 (保留 三 位 小 数 ) 


现在 该 计算 另 一 个 概率 了 : 
的 概 谤 是 多 少 ? 


我 们 需要 求 P( 第 一 局 黑色 第 二 局 黑鱼 )， 由 了 于 这 而 个 事件 桐 乏 独 立 ， 因 此 ， 


18/38 x 18/38 = 324/1444 


世上 没有 俐 问题 


阅 : 轮 盘 财 中 的 每 一 局 都 是 独立 
事件 吗 ? 为 什么 ? 


每 ;， 没 错 ， 都 是 独立 事件 。 轮 
盘 的 每 一 次 转动 都 不 会 前 后 彩 响 。 
小 妹 在 每 一 局 中 停 在 红色 、 黑 色 或 
绿色 球 位 上 的 概率 是 不 变 的 。 


内 : ”你 已 经 渍 示 过 如 何 使 用 概率 
树 论证 独立 事件 。 如 何 使 用 维 恩 图 判 
断 几 个 事件 是 否 相互 独立 ? 


签 : 


维 思 图 的 确 不 是 体现 相关 


性 的 最 好 方法 。 维 思 图 在 检验 交集 、 


表现 互 斥 事 件 方面 表现 被 佳 ， 但 在 
表现 独立 性 方面 效果 并 不 好 。 


“小 球 连 续 两 次 停 在 黑色 球 位 上 ” 





重 受 统计 量 


如 果 A 和 E 机 独立 ， 则 ; 
P(A | B) = P(A) 


如果 上 式 对 任何 两 个 事 
件 成 立 ， 则 这 两 个 事件 
必 为 娄 立 事件 。 同 时 ， 


P(A NM B) = P(A) x P(E) 





把 握 机 会 


瑜伽 班 与 游泳 班 案例 


Head First 健 身 俱乐部 为 自己 能 为 每 一 位 前 来 健身 的 人 找到 合适 的 班 
级 感到 自豪 ， 这 正 是 俱乐部 风靡 老 中 少 健身 者 的 原因 。 


健身 俱乐部 目前 正在 动脑 筋 ， 为 的 是 最 有 效 地 推销 它 新 开设 的 瑜伽 
班 ， 他 们 想 知道 ， 是 否 参加 游泳 班 的 人 更 有 可 能 参加 瑜伽 班 。“ 也 
许 我 们 可 以 给 游泳 班 学 员 一 些 折 扣 ， 鼓 励 他 们 参加 瑜伽 班 。” 


首席 执行 官 不 同意 。“ 我 想 你 们 错 了 ”， 他 说 ，“ 我 想 参 加 
游泳 班 的 人 和 参加 瑜伽 班 的 人 是 相互 独立 的 ， 我 不 认为 参加 
游泳 班 的 人 比 其 他 人 更 有 可 能 参加 瑜伽 班 。” 


他 们 调查 了 96 个 人 ， 问 他 们 是 否 参加 游泳 班 或 瑜伽 班 。 在 这 96 个 人 
中 ， 有 32 人 参加 瑜伽 班 ，72 人 参加 游泳 班 。 有 24 人 最 为 积极 ， 两 个 
班 都 参加 了 。 





那么 ， 谁 对 谁 错 ? 瑜伽 班 和 游泳 班 是 相关 ， 还 是 相互 独立 ? 
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面对面 ; 相关 与 独立 


面对面 





相关 : 


独立 老兄 ， 很 高 兴 看 到 你 露面 。 我 早 就 想 还 住 你 
问 问 了 。 


哦 ,我 听 说 你 总 给 菜鸟 统计 师 车 麻烦 ， 没 有 你 的 


时 候 ， 他 们 干 得 很 虎 利 ， 可 是 只 要 你 一 来 ， 天 啦 ， 


错误 概率 就 满天飞 啊 ! 小 门 尤 其 对 你 有 意见 。 


就 是 你 这 种 简单 的 态度 给 人 们 带 来 了 麻烦 。 他 们 
想 : “ 嘿 ， 这 位 独立 老兄 看 起 来 挺 简单 ， 我 就 用 
他 来 算 这 个 概率 。” 然 后 呢 ， 你 知道 的 ,把 所 
有 的 概率 胡乱 混在 一 起 。 这 可 不 是 处 理 相 关 事 件 
的 正确 方法 。 


你 不 明白 事情 的 严重 性 。 如 果 人 们 按照 你 的 方式 
计算 镍 概率 ,而 事件 是 相关 事件 ， 那 么 他 们 肯定 


会 得 出 错误 答案 ,这 可 不 太 好 。 对 于 相关 事件 ， 


只 有 在 考虑 小 | 的 时 候 一 小 | 代表 已 知 条 件 ， 你 
才能 得 出 正确 答案 。 
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TS 今夜 谈 ; 相关 与 狼 立 规 讨 相互 阅 的 部 异 


独立 : 


是 吗 ， 相 关 老兄 ? 为 什么 呢 ? 


我 有 点 儿 和 伤心 呢 ， 小 所 居然 说 我 的 坏话 ， 我 以 为 
自己 让 他 过 得 轻松 了 呢 。 他 想 算出 发 生 两 个 独立 
事件 的 概率 ? 容易 ! 只 要 把 两 个 事件 的 概率 相 乘 ， 
就 大 功 告 成 了 。 


你 言 过 其 实 了 。 即 使 人 们 决心 用 我 而 不 用 你 ,也 
不 见得 会 引起 多 大 差别 。 


我 不 能 说 自己 给 了 他 们 很 多 关注 。 对 于 独立 事件 
来 说 ,概率 结果 都 是 一 样 的 。 


相关 : 

你 又 来 了 一 你 把 事情 看 得 过 于 简单 。 好 吧 ， 我 
已 经 说 得 够 多 了 。 我 想 人 们 应 该 首先 想到 我 ， 而 
不 是 你 ,才能 把 所 有 这 些 问 题 都 搞 清 楚 。 


彻底 想 清楚 事情 是 不 是 相关 事件 。 我 来 举 个 例 
子 : 假设 你 有 一 副 牌 ， 共 52 张 ， 其 中 13 张 是 方块 。 
想象 你 随机 抽 了 一 张 牌 ， 发 现 是 方块 。 发 生 这 个 
事件 的 概率 有 多 大 ? 


再 抽 第 二 张 牌 会 怎样 ? 抽出 第 二 张 方块 的 概率 是 
多 大 ? 


不 对 ! 这 些 事件 是 相关 的 。 你 不 能 再 认为 这 副 牌 
里 有 13 张 方块 -一 你 已 经 抽 掉 了 一 张 ， 因 此 只 剩 下 
51 张 牌 ， 其 中 方块 12 张 。 概 率 变 为 12/151， 或 者 说 
4/17。 


性 它 们 不 是 。 当 人 们 首先 想到 你 的 时 候 ， 他 们 就 
会 作出 许多 不 人 恰当 的 假设 。 这 就 难怪 小 放 乱 成 一 
团 了 。 


别 放 在 心 上 , 下 次 考虑 事情 小 心 全 面 一 些 就 行 了 。 


把 握 机 会 


独立 : 


是 吗 ? 怎么 会 这 样 呢 ? 


这 简单 。13752, 或 者 说 1/4。 


一 样 旷 ， 对 不 ? 174。 


不 公平 ， 我 以 为 你 把 第 一 张 牌 放 回去 了 ! 


那 就 意味 着 抽出 方块 的 概率 和 以 前 一 样 ， 我 就 是 
对 的 。 这 些 事件 应 该 是 独立 的 。 


不 ,谢谢 你 给 我 讲 这 些 ， 相 关 老 兄 ， 很 高 兴 我 们 
有 机 会 把 事情 讲 清楚 。 
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5 分 钟 推理 破解 


破解 : 瑜伽 班 与 游泳 班 案 例 


瑜伽 班 和 游泳 班 是 相关 的 还 是 独立 的 ? 5 分 钟 
首席 执行 官 是 对 的 -一 两 个 班 是 独立 的 。 
下 面 是 他 了 解 的 信息 : 
96 人 中 有 32 人 上 瑜伽 班 ， 因 此 : 

P( 瑜 伽 ) = 1/3 
72 人 上 游泳 班 ， 因 此 : 

P( 游 泳 ) = 3/4 
24 人 两 个 班 都 上 ， 因 此 : 

P( 瑜 伽 站 游泳 ) = 1/4 
可 我 们 怎么 知道 这 两 个 班 是 相互 独立 的 呢 ? 让 我 们 将 (瑜伽 ) 和 
P( 游 泳 ) 相 乘 ， 看 看 结果 。 

P( 瑜 伽 ) x P( 游 泳 ) = 1/3 x 3/4 

= 1/4 

由 于 这 个 结果 等 于 P( 瑜 伽 所 游泳 )， 于 是 我 们 知道 两 个 班级 是 相 
互 独立 的 。 
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把 握 机 会 


相关 还 是 独立 ? 


下 面 是 一 些 情况 和 事件 ， 请 说 出 哪些 是 相关 事件 ， 哪 些 是 独立 事件 。 





相关 独立 


掷 出 硬币 ， 连 续 两 次 正面 朝 上 。 口 口 
从 抽 居 里 拿 福子， 直到 找 出 一 双 。 


从 一 盒 巧 克 力 中 随机 拿 巧 克 力 ， 连 续 两 
次 拿 到 黑 巧 克 力 。 


从 一 副 牌 里 拿 出 一 张 牌 ， 然 后 抽出 另 一 
张 牌 。 


从 一 副 牌 里 抽出 一 张 牌 ,将 这 张 牌 放 回 
去 ， 然 后 抽出 另 一 张 牌 。 


在 星期 二 (已 知 条 件 ) 下 雨 。 
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相关 还 是 独立 ? 解答 





相关 还 是 独 学 ? 
钥 革 


下 面 是 一 些 情况 和 事件 ， 请 说 出 娜 些 是 相关 事件 ， 哪 些 是 独立 事件 。 


掷 第 二 技 古 币 胸 拖 率 不 肥 
衫 第 一 要 硬币 的 影响 . 相关 


掷 出 硬币 ， 连 续 两 次 正面 朝 上 。 


在 取出 一 只 糙 了 后 ， 下 一 决 取 入 B 时 ， 原 来 
的 标 孚 数 就 减少 了 ， 这 会 影响 概率 。 


“SS 从 抽 屋 里 拿 袜子 ， 直 到 找 出 一 双 。 


从 一 盒 巧 克 力 中 随机 拿 巧 克 力 ， 连 续 两 
次 拿 到 黑 巧 克 力 。 


从 一 副 牌 里 拿 出 一 张 牌 ， 然 后 抽出 另 一 WS# 
张 牌 。 


从 一 副 牌 里 抽出 一 张 牌 ,将 这 张 牌 放 回 四] 
去 ， 然 后 抽出 另 一 张 牌 。 


隶 会 由 于 是 星期 二 而 更 有 可 能 下 而 
Dp 


在 星期 二 (已 知 条 件 ) 下 雨 。 器 中 
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把 握 机 会 


赢 钱 了 ! 赢 钱 了 ! 


轮 盘 连 转 两 次 ， 小 球 都 落 在 30 号 红色 球 位 上 
双 倍 





你 赢 了 


你 已 经 在 肥 蛋 赌场 的 轮 盘 赌 桌 上 学 了 大 量 概率 知识 ， 
这 些 知识 将 在 赌场 中 的 其 他 赌博 游戏 中 派 上 用 场 。 不 


De 
[ 肥 委 赌场 消息 : 
我 们 松 了 一 口气 , ] 










真是 太 将 了 ， 我 们 知道 赢 取 各 种 赌 法 
的 几率 . 不 过 ， 除 了 概率 ， 是 不 是 该 
多 懂 一 些 ， 才 能 智 脏 赌场 ? 


除了 赢 钱 概率 ， 还 需要 知道 赢 钱 的 金额 ， 以 便 
决定 是 否 该 冒险 下 注 。 

对 于 一 个 概率 极 低 的 事件 ， 如 果 回 报 足 以 弥补 
所 承担 的 风险 ， 则 值得 押 上 一 注 。 在 下 一 章 中 ， 
我 们 将 看 看 如 何 将 回报 纳 和 人 概率 计算 式 ， 帮 助 
我 们 作出 更 有 根据 的 赌博 决策 。 
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概率 谜 题 


链 万 的 染 罗 者 


三 位 健忘 的 朋友 决定 外 出 用 餐 ， 但 他 们 志 了 打算 在 哪儿 会 面 了 。 
弗 菜 德 决定 掷 硬 币 帮忙 : 如 果 正 面 着 地 ， 则 去 蒂 勒 餐厅 ; 如 果 反 
面 着 地 ， 则 去 意大利 餐厅 。 乔 治 也 掷 了 硬币 : 正面 着 地 ， 去 意 大 
利 餐 订 ; 反面 着 地 ， 去 蒂 勒 餐厅 。 罗 恩 决 心 只 去 意大利 和 餐厅， 
为 他 喜欢 那 家 餐厅 的 食物 。 


三 位 朋友 见面 的 概率 有 多 大 ? 其 中 一 位 单独 用 矢 的 概率 有 多 大 ? 
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加 下 面 再 增加 一 些 轮 盘 周 概率 ， 供 你 练习 。 


钴 习 





1, 已 知 停 球 位 置 为 黑色 ， 求 小 球 停 在 数字 17 的 概率 。 


2. 小 球 连 续 两 次 停 在 22 球 位 的 概率 。 


3. 已 知 停 球 位 置 为 红色 ， 求 小 球 停 在 编号 大 于 4 的 球 位 的 概率 。 


4. 小 球 停 在 1、2、3 或 4 的 概率 。 
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谜 题 解答 


姨 在 的 染 针 省 


三 位 健忘 的 朋友 决定 外 出 用 餐 , 但 他 们 忘 了 打算 在 哪儿 会 面 了 。 
弗 莱 德 决定 掷 硬币 帮忙 : 如 果 正 面 着 地 ， 则 去 幕 鞭 餐厅 ; 如 果 
反面 着 地 ， 则 去 意大利 餐厅 。 乔 治 也 掷 了 硬币 : 正面 着 地 ， 去 
意大利 餐厅 ; 反面 着 地 ， 去 蒂 勒 餐厅 。 罗 恩 决 心 只 去 意大利 餐 
厅 ， 因 为 他 喜欢 那 家 餐厅 的 食物 。 


三 位 朋友 见面 的 概率 有 多 大 ? 其 中 一 位 单独 用 餐 的 概率 有 多 大 ? 


意大利 餐厅 


如 果 所 有 凑 友 都 琴 弄 ， 则 肖 完 是 在 
意大利 餐厅 。 我 们 需要 束 ， 


P{ 办 轧 意 大 利 门 硕 某 大 意大利 门 章 治 意大利 ) 
一 1Tx0Osx05 一 0D25 


意大利 时 厅 


有 1 个 人 半 禾 用 餐 拘 情况 是 ， 栅 菜 德 和 乔治 去 闵 
赠 餐 厅 ， 怖 菜 德 去 着 勒 餐厅 ， 而 乔治 去 意大利 餐 
厅 ， 或 处 治 去 送 勒 餐厅 ， 而 若菜 德 去 意大利 餐厅 。 


(0.5 x 0.5) + {0.5 x 0.5) + (0.5 x 0.5) = 0.75 
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把 握 机 会 


下 面 再 增加 一 些 轮 盘 赌 概率 ， 供 你 练习 。 
习 


解答 


1. 已 知 停 球 位 置 为 黑色 ， 求 小 球 停 在 数字 17 的 概率 。 


黑色 妹 位 有 18 个 ， 其 中 之 一 编号 17。 
P(17 | 里 ) = 1/18 = 0.0556 (保留 三 们 小数 ) 


2. 小 球 连 续 两 次 停 在 22 球 位 的 概率 。 


我 们 常 要 刺 P{22 由 22)， 由 于 这 此 事件 是 独立 事件 ， 因 尼 这 个 
式 了 等 于 P(22)xP{22)。 停 妹 结 果 为 22 拘 机 率 是 17]38. 因 此 ， 


P(22 站 22) = 1/38 x 1/38 = 1/1444 = 0.00069 { 保 留 五 们 小 数 ) 


3. 已 知 停 球 位 置 为 红色 ， 求 小 球 停 在 编号 大 于 4 的 球 位 的 概率 。 


P( 大 于 4 | 红 ) =1 -PP(4 或 4 以 下 | 红 ) 
小 于 4 网 红 多 球 住 有 2 个 ， 办 此 ， 


1 ~ (1/18 十 1/18) = 8/9 = 0.889 (保留 三 人 路 数 ) 


4. 小 球 停 在 1、2、3 或 4 的 概率 。 


备 个 娃 位 鹏 概率 区 1/38， 凡 此 所 述 事 件 摧 概率 为 
4 x 1/38 = 4/38 = 0.105 (保留 三 位 路 数 ) 
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5 高 散 概 率 分 布 的 和 运 闭 
米 X 
_ 善 用 期 望 + 


好 了 ， 从 树 上 挤 下 来 不 是 我 们 
期 户 的 结果 ， 不 过 ， 对 这 种 事 
我 们 必须 看 和 远 一 些 





意外 从 天 而 降 ， 未 来 如 何 演变 ? 

前 文 讲 到 如 何 通过 概率 得 知 发 生 某 些 事件 的 可 能 性 的 大 小 。 可 惜 概率 并 非 万 能 ， 
它 无 法 指出 所 发 生 的 这 些 事情 的 整体 影响 ， 也 无 法 指出 这 种 整体 影响 对 你 的 具体 
影响 。 不 错 ， 你 有 时 会 在 轮 盘 赌 中 大 赚 特 赚 ， 但 你 赚 到 的 钱 真 的 填 得 平 那些 赔 
掉 的 钱 吗 ? 在 本 章 中 ， 我们 将 讲述 如 何 利 用 概率 预测 长 期 结果 ， 以 及 如 何 量度 
这 些 预测 结果 的 确定 性 。 


进入 新 的 篇 章 
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老虎 机 赔 率 


重 癌 肥 蛋 赌场 


你 曾经 痴迷 于 老虎 机 忽 闪 忽 闪 的 灯光 吗 ? 
好 吧 ， 你 走运 了 ， 肥 和 蛋 赌场 有 一 长 排 灯光 
闪闪 的 老虎 机 等 着 你 来 玩 呢 ， 让 我 们 来 到 
其 中 一 台 老虎 机 前 ， 以 1 美元 一 局 ( 拉 一 次 
杆 ) 的 赌 本 玩 起 来 。 没 准 儿 你 会 大 发 一 笔 ! 
这 台 老 虎 机 有 三 个 窗口 ， 如 果 三 个 窗口 全 
部 恰到好处 地 亮 起 来 ， 成 堆 的 硬币 就 会 滚 
滚 而 下 。 















每 局 1 美元 
$ $ $ -420 

全 盆 ( 任 意 硕 序 ) =$15 

分 公分 =i20 

SOO = 


A 
“Ww 





大 把 赢 钱 当然 充满 请 总 ， 但 在 开 
赌 之 前 ， 我 希望 先 搞 清 楚 接 上 这 
些 组 合 的 概率 


似乎 我 们 是 有 办 法 算 一 算 的 。 下 面 是 一 个 特定 图 像 
出 现在 一 个 特定 窗口 中 的 概率 。 





这 三 个 窗口 相互 独立 ， 即 每 个 窗口 中 出 现 的 图 像 对 
其 他 窗口 中 出 现 的 图 像 没 有 影响 。 


机 机 出 现在 这 个 窗 
口中 的 概率 是 0.2, 
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善 用 期 望 


化 身 赌 全 


看 一 看 上 一 页 的 老虎 机 海报 ， 你 的 任务 是 化 身 财 第 ， 算 


出 海报 上 的 各 种 组 合 的 发 生 概 率 。 一 无 所 获 的 栋 率 
是 多 少 ? 


健 健儿 的 模 洗 下 多分 的 梳 率 (人 尾 洛 师 课 ) 





和 四 外 外 Hh 梳 蒜 分 分 分 的 梳 率 





一 无 所 获 的 模 池 
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化 身 财 徒 解 管 


需 一 看 上 一 页 的 老虎 机 海报 ， 你 的 任务 是 化 身 财 逢 ， 算 
出 海报 上 的 各 种 组 合 的 发 生 概率 。 一 无 所 获 的 概率 
是 多 少 ? 














Fi: gS 人 $ 的 模 地 
P(, 丰 , 丰 ) =P( 人 才 ) x P( 寺 ) x P( 和 ) 
=0.1x0.1x0.1 入、 


= 0.001 一 个 窗口 中 出 现 一 个 美 
元 符号 的 概率 是 0.1 


争 多 参 的 模 地 (任意 烦 邦 ) 


出 现 这 种 组 合 的 情况 有 三 种 : 
P{( 牛 丰 栅 机 ) 十 P( 牛 樱桃 , 后 ) 十 PP( 栅 栅 , 丰 , 丰 ) 
= (0.12 x 0.2) + (0.1? x 0.2) + (0.1* x 0.2) 


= 0.006 


当 分 分 的 梳 率 


P( 樱 栅 , 机 枫 , 樱 机) = 二 (机 栅 ) xP( 术 机) x P( 栅 机) 


一 0.2x0.2x0.2 





EN EE 

包扎 包 的 模 些 
P( 柠 楼 , 柠 楼 , 柠 树 ) = P( 柠 权 ) x P( 柠 榜 ) x 己 ( 柠 样 ) 

一 个 窗 口中 出 瑰 一 

个 柠 样 与 其 他 两 个 窗 

口中 出 现 柠 榜 是 相互 = 0.008 

独立 网 事件 ， 因 此 

将 这 三 个 概率 相 乘 ， 







一 0.2x0.2x0.2 


= 0.008 


一 匹 所 获 的 模 洗 


即 没有 接 上 伍 何 赢 钱 组 合 的 概率 。 
P( 赔 钱 ) = 1 -P(4, 丰 , 丰 ) -PP(, 丰 , 樱桃 (位 意 顺 冶 )) -PP( 栅 栅 , 机 杰 , 栅 枫 ) -一 ( 柠 样 , 柠 样 , 柠 样 ) 


一 1 一 0.001 -0.006 -0.008 一 0.008 


与 其 笑 册 所 可 能 出 更 的 凡 懂 方 、， 
一 还 条 如 囊 出 P( 赔 钱 ) = 1 P( 赢 钱 ) . 


= 0.977 这 是 前 面 算出 的 四 个 概率 . 
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我 们 可 以 写 出 老虎 机 概率 分 布 


下 面 是 老虎 机 的 各 种 赢 钱 组 合 的 概率 。 ，， 沁 是 允 简 面 算出 的 










这 张 表 看 上 去 很 有 用 ,未 过 我 在 起 ， 我 们 是 未 是 
能 够 再 深入 一 些 ? 我 们 已 经 求 出 了 篆 种 赢 钱 组 合 的 
概率 ， 但 我 们 真正 感 兴 趣 的 是 能 赚 多 岁 钱 或 者 会 
赔 多 少 钱 。 







我 们 不 仅 想 知道 赢 钱 的 概率 ， 还 想 知道 赚钱 数额 一 收益 
目前 我 们 是 基于 符号 组 合 来 写 概率 ， 这 就 很 难 一 眼看 出 我 们 能 赚 多 
少 ， 好 在 我 们 并 不 一 定 要 这 样 写 。 

现在 让 我 们 放弃 基于 老虎 机 图 形 写 概率 的 做 法 ， 代 之 以 基于 每 一 局 
的 收益 或 赔付 写 概率 。 为 此 还 需 做 这 样 一 个 计算 : 用 每 一 个 组 合 对 
应 的 赢 金 ( 即 海报 上 注 明 的 金额 ) 减 去 玩 一 局 的 本 金 ( 1 美元 ) 。 












[02 CA 


若 系 能 撞 上 赢 钱 组 接 上 某 种 赢 钱 组 合 后 的 收 
合 ， 就 得 赔 掉 1 美元 . 向 提 本 轰 蔡 ， 伍 益 = 赢 金 - 1 美元 本 金 ， 


天 于 收益 写 出 ， 
表格 给 出 了 赢 局 的 概率 分 布 一 即 老虎 机 每 一 种 可 能 


收益 (或 赔付 ) 所 对 应 的 概率 的 集合 。 
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概率 分 布 细 细 看 


DS 梳 亩 分 布 乡 镶 菠 


在 推算 老虎 机 概率 时 ， 你 计算 了 每 个 赢 局 (或 赔 局 ) 的 概率 ， 即 ， 你 计算 了 一 
个 随机 变量 的 概率 分 布 。 随 机 变量 是 一 个 可 以 等 于 一 系列 数值 的 变量 ， 而 这 一 
系列 数值 中 的 每 一 个 值 都 与 一 个 特定 概率 相关 联 。 在 肥 蛋 赌场 老虎 机 这 个 例 
子 中 ， 随 机 变量 代表 我 们 将 在 每 一 局 赌局 中 赢得 的 收益 。 





















随机 变量 通常 用 大 写字 母 表 示 ， 如 X 或 Y; 变量 能 够 采用 的 特定 数值 则 用 小 
写字 母 表 示 ， 如 x 或 y。 于 是 ，P(X = x) 则 表示 “变量 X 取 特定 数值 x 的 概率 ”. 


以 下 是 用 上 述 表示 法 表示 的 老虎 机 的 概率 分 布 : 


番 个 组 合 的 收 


这 里 的 变量 具有 离散 性 ， 即 该 变量 只 能 取 确 定数 值 


除了 拟定 概率 分 布 表 ， 我 们 还 可 以 用 图 形 来 表示 概率 分 布 。 下 面 是 一 张 条 形 
图 ， 用 于 表示 老虎 机 的 概率 。 





老虎 机 概率 





收藏 为 4 基 无 、9 骤 元 、14 
在 这 种 条 形 图 上 ， 上 长 方形 菜 元 和 19 羡 元 的 概率 太 人 小 
水 常 细 ， 简直 就 是 一 条 线 。 3 了， 在 图 上 几乎 看 不 出 来 . 
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阅 :我 们 为 什么 不 能 用 符号 ， 反 
而 要 用 数字 呢 ? 我 可 没 把 握 是 不 是 页 
的 会 赢 那 么 多 钱 。 


答 : 我 们 可 以 用 符号 ， 但 用 数字 
代替 符号 能 做 更 多 事 ， 因 为 数字 可 
以 参加 计算 。 例 如 ， 你 即将 看 到 如 
何 利 用 这 些 数字 计算 我 们 能 够 期 望 
在 每 一 局 赌局 中 赢 多 少 钱 。 如 果 只 
用 符号 的 话 ， 可 作 不 了 这 样 的 预测 。 


阅 :， 如 果 我 想 用 维 恩 图 体现 概率 
分 布 ， 能 办 到 吗 ? 


签 ;， 用 这 个 方法 体现 概率 分 布 不 
是 特别 合适 。 维 因 图 和 概率 树 在 计 
算 概率 时 很 有 用 ， 但 对 于 概率 分 布 
来 说 ， 所 有 概率 都 早已 计算 好 了 -。 








来 吗 ? 


世上 没有 俐 问题 


阅 : 我 能 用 任意 字母 表示 某 个 变 
量 吗 ? 


答 : 可 以 ， 只 是 别 用 乱 了 。 最 党 
见 的 情况 是 用 字母 表 末 尾 的 几 个 字 
母 来 表示 ， 例 如 X 和 Y 


| 间 :我 应 该 用 相同 的 字母 表示 
变量 和 数值 吗 ? 或 许 我 该 用 X 代 表 变 
量 ，y 代 表 数 值 ? 


答 : ”从 理论 上 讲 这 并 非 不 可 ， 不 
过 在 实际 应 用 中 ， 你 会 发 现 用 不 同 
的 字母 更 容易 引起 混淆 ， 最 好 坚持 
用 相同 的 字母 分 别 表示 变量 和 数值 
| 问 : ”你 说 过 ， 高 散 随机 变量 就 是 
能 精确 指出 其 数值 的 变量 ， 我 倒 觉 得 
每 个 变量 都 有 这 种 特点 ， 难 道 不 是 吗 ? 


我 寺 嘛 要 关心 概率 分 布 ? 我 只 想 知 
道 会 在 老虎 机 上 赢 多 少 钱 ， 人 能 算出 


善 用 期 望 







只 要 算出 概率 分 布 ， 就 能 利用 概率 分 布 确 定 预期 结果 。 
在 肥 蛋 老虎 机 这 个 例子 中 ,我 们 可 以 利用 概率 分 布 确定 
你 的 长 期 期 望 收益 (或 亏损 ) 。 


答 。 并 非 如 此 。 在 老虎 机 例子 
中 ， 你 确切 地 知道 每 一 种 符号 组 合 
的 相应 收益 一 确切 得 不 能 再 确切 ， 
无 论 玩 多 少 次 ， 对 于 每 一 局 赌局 来 
说 ， 可 能 的 赢 钱 数 值 都 保持 不 变 。 


但 还 有 一 些 时候 ， 你 得 到 的 是 一 个 
数值 范围 ， 这 个 数值 范围 内 的 任何 
数值 都 有 可 能 出 现 。 例 如 ， 假 定 要 
求 你 测量 一 些 长 度 在 10 英 寸 到 11 英 
寸 范围 内 的 丝线 的 具体 长 度 ， 那 么 ， 
丝线 长 度 完全 可 以 是 这 个 范围 内 的 
任何 数值 。 

暂时 不 用 过 于 担心 其 中 区 别 ， 我 们 将 
在 本 书后 续 部 分 详 加 说 明 。 目 前 ， 我 
们 所 研究 的 随机 变量 都 将 是 离散 性 的 。 
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移 敬 概率 分 布 的 期 握 与 方差 


期 望 指 示 预 测 结果 …… 


你 已 经 有 了 老虎 机 的 收益 概率 分 布 ， 但 现在 需要 知道 自己 能 
够 期 望 获 得 的 长 期 收益 。 为 了 算出 这 个 期 望 数额 ， 可 以 先 算 
出 在 典型 情况 下 可 以 期 望 每 一 局 赢 多 少 或 赔 多 少 ， 即 可 以 求 
出 统计 学 上 的 所 谓 期 望 。 

变量 X 的 期 望 和 均值 有 点 儿 像 ， 甚 至 连 计算 方法 也 相似 ， 但 
它 描述 的 是 概率 分 布 。 为 了 求 出 期 望 ， 可 将 每 个 数值 x 乘 以 该 
数值 的 发 生 概率 ， 然 后 将 所 有 乘积 求 和 。 

变量 X 的 期 望 通常 写作 E(X). 但 有 时 候 也 会 写作 ， 也 就 是 E(X) a 
均值 的 符号 。 我 们 这 样 打 比方 吧 ， 期望 和 均值 是 一 对 双胞胎 ， 

但 一 出 生 就 由 不 同人 家 领养 了 。 

下 面 是 E(X) 的 计算 式 : 将 每 个 数值 与 傣 概 车 相 系 











我 是 期 营 ， 当 
我 像 均 值 一 样 
就 行 . 


下 面 是 E(x) > E(X) = 2xP(X = Xx) 
网 计算 六 了 
将 所 规 又 积 桐 加， 


让 我 们 用 这 个 算式 计算 老虎 机 的 收益 期 望 。 下 面 是 所 用 
概率 分 布 的 提示 数字 : 


ET CONE CE CE CE CO 
[P(X = x) [0977 [oo08 [oo08 ooo06 [ooo0 | 


E(X}=(-1 x 0.977) + (4 x 0.008) + (9 x 0.008} + (14 x 0.006) + (19 x 0.001) 
= -0.977 + 0.032 + 0.072 + 0.084 + 0.019 


077、 让 生 们 用 这 个 算式 计算 老虎 机 的 收 半 关 和 
下 面 是 所 用 氢 率 分 布 的 提示 数字 ， 


换 名 话说 ， 在 多 次 拉杆 之 后 ， 你 能 够 期 望 每 一 局 赔 掉 0.77 
美元 ， 也 就 是 说 ， 如 果 玩 100 次 老虎 机 ， 你 能 够 期 望 赔 掉 
77 美 元 。 
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苦 用 期 望 


方差 指示 结果 的 分 散 性 

期 望 指出 每 一 局 赌局 能 够 期 望 得 到 的 平均 收益 ， 如 果 每 一 次 都 赔 这 么 多 
钱 ， 那么 赌博 有 何 乐趣 ?” 谁 又 愿意 赌博 ? 

有 理由 期 望 每 一 局 赌博 都 赔钱 并 不 表示 连 一 丁点 儿 赢 大 钱 的 希望 都 没有 
和 均值 一 样 ， 期 望 并 没有 全 面体 现 出 每 一 局 赌局 有 可 能 存在 的 收益 变化 
你 觉得 该 怎么 量度 这 种 变化 ? 


老虎 机 概率 
mm 
其 
中 
ad 
一 
a 
天 桨 在 此 ， 请 人 吧 ? 
-1 0 4 9 
TT 
Wp 簿 变化 ， 
过 访 组 次 二 信众 汪 






我 想 …… 如 果 期 望 与 声 
值 相 仅 ， 那 么 能 不 能 使 用 
蘑 种 方差 呢 ? 我 们 之 前 就 
是 这 样 做 的 . 








概率 分 布 确实 有 其 方差 。 

期 望 指出 一 个 变量 的 典型 值 或 平均 值 ， 但 并 不 提供 
有 关 数 值 分 散 性 的 任何 信息 。 在 老虎 机 赌博 中 ， 如 
能 得 到 分 散 性 信息 ， 我 们 将 能 更 多 地 了 解 潜在 收益 
的 变化 情况 。 

像 第 3 章 中 的 做 法 一 样 ， 我 们 可 以 使 用 方差 来 量度 这 
种 分 散 性 。 让 我 们 看 看 具体 做 法 。 
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计算 离散 概率 分 布 的 方差 


方差 和 概率 分 布 
先 回顾 一 下 第 3 章 : 我 们 计算 了 一 批 数字 的 方差 -一 我 们 算出 每 个 数字 的 
(X- jz， 然后 取 所 有 计算 结果 的 平均 值 。 


类 似 地 ， 我 们 可 以 算出 变量 X 的 方差 ， 但 我 们 不 求 (X- 上 六 的 平均 值 ， 而 是 
求 (X-) 的 期 望 。 计 算 公式 如 下 : ,是 BO 的 另 一 卉 记 


> Var(X) = E(X - p)? 


这 是 方 类 一 -Vay(x , 
\ ) 是 > )* 的 
X 的 方 类 到 简便 记 ; 我 们 需要 带 一 ” 

条 便 记 法 ， 守望 一 用 哪 种 方法 呢 ? 


只 有 一 个 问题 : 如何 求 出 (x - p. ?的 期 望 ? 


如 何 计算 E(X - HU) 经 
求 E(X- ?的 方法 与 求 E(X) 的 方法 非常 相似 。 


计算 E(X) 时 : 取 概 率 分 布 中 的 每 一 个 数值 ， 乘 以 其 概率 ， 然 后 将 各 个 
乘积 相 加 。 也 就 是 使 用 下 式 进 行 计算 ; 


E'(X) = ZxP(X = Xx) 


Var(X) 量 度 收益 的 变 
化 范围 。 


计算 X 的 方差 时 : 计算 每 个 数值 x 的 (x- ph )*?， 用 所 得 结果 乘 以 相应 数值 
x 的 发 生 概 率 ， 然 后 将 各 个 结果 相 加 。 


出 
取 每 一 个 数值 X， 并 
xh): 用 所 得 结果 条 


相应 x 的 发 生 概 率 eseee 


E(X - pH)? = (x - b)2P(X = x) 


i 然后 将 所 
韦 素 积 相 加 。 


也 就 是 说 ， 你 不 是 用 x 乘 以 其 相应 概率 ， 而 是 用 (x- 上 ): 乘 以 相应 x 
的 发 生 概率 。 
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善 用 期 刻 


证 我 们 筑 算 老虎 机 的 方差 


让 我 们 看 看 能 否 用 上 述 方法 计算 老虎 机 的 方差 ' 为 [ET [9 Te he | 
此 ， 我 们 用 每 一 个 值 减 去 ， 取 差 的 平方 ， 然 后 乘 以 | 05970006 [oo08 |]ooog [oo07 | 


概率 。 提示 一 下 ， E(X) 或 bb 等 于 -0.77。 
< 垢 们 在 204 页 求 得 
三 一 了 
Var(X) = ECX - 由) E09 = 
= (-1+0.77)2 x 0.977 + (410.77)2 x 0.008 + (9+0.77)? x 0.008 + (14+0.77) x 0.006 + (19+0.77)? x 0.001 
= (-0.23)? x 0.977 + 4.77? x 0.008 + 9.77? x 0.008 + 14.77? x 0.006 + 19.772 x 0.001 人 
(XL): x P=X) 


= 0.0516833 + 0.1820232 + 0.7636232 + 1.3089174 + 0.3908529 


= 2.6971 
这 就 是 说 ， 当 收益 期 鹿 为 -0.77 时 ,方差 为 2.6971。 






剖 标 准 受 呢 ? 我 们 也 能 计算 蚂 ? 


就 像 可 以 算出 方差 一 样 ， 也 可 以 算出 概率 分 布 航标 准 头 。 


概率 分 布 的 标准 差 与 数据 集 的 标准 差 作 用 相似 ， 是 一 种 量度 数据 
与 数据 中 心 的 期 望 距 离 的 方法 。 


像 以 前 一 样 ， 标 准 差 的 计算 方法 是 取 方差 的 平方 根 ， 如 下 所 示 : 


元 但 可 以 用 和 以 荫 一 样 


o =(Var(X) 和 一 一 一 沁 千 号 表示 标准 基 ， 


这 就 是 说 ， 老 虎 机 收益 的 标准 差 是 W2.5971, 即 1.642， 这 表示 从 平 
均 情 况 看 来 ， 我 们 的 每 一 局 收益 与 期 望 收 益 - 0.77 之 间 的 距离 是 


四 如 动 动 脑 


你 愿意 老虎 机 的 方差 高 一 些 还 是 低 一 些 ? 为 什么 ? 
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世上 土 没有 傻 问题 


阅 ;这 么 说 期 望 与 均值 极为 相似 ， 
那么 对 于 概率 分 布 来 说 ， 有 没有 类 似 
中 位 数 或 是 众 数 之 类 的 东西 呢 ? 


签 : 你 可 以 算出 最 可 能 出 现 的 
概率 ， 这 就 有 点 儿 像 雁 数 ， 但 一 般 
不 需要 这 么 做 。 在 研究 概率 分 布 的 
时 候 ， 统 计 师 最 感 兴趣 的 测量 值 就 
是 期 望 。 


阅 : 期望 是 不 是 应 该 等 于 X 能 够 
取 用 的 某 个 数值 ? 


签 : 不 一 定 。 就 像 一 个 数据 全 
的 均值 不 一 定 等 于 这 个 数据 集中 的 
某 个 数据 ， 一 个 概率 分 布 的 期 望 也 
不 一 定 等 于 X 能 够 取 用 的 一 个 数值 。 





E(X) =SxP(X=x) 
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“变量 X 的 期 里 ”计算 公立 好 下 ， 






世上 没有 僵 问题 


阅 :， 这 里 的 方差 和 标准 差 和 我 们 
以 前 研究 过 的 数值 的 方差 和 标准 差 
是 一 样 的 吗 ? 


答 :; 是 一 样 的 ， 不 过 这 一 次 研 
完 的 是 概率 分 布 。 数 据 集 的 方差 和 
标准 差 是 量度 数据 与 均值 的 距离 的 
方法 ， 而 概率 分 布 的 方差 和 标准 差 
是 量度 一 些 特定 数值 的 概率 的 分 散 
请 况 的 方法 。 


问 : ”我 觉得 E(X - hb) 很 容易 让 人 混 
消 ， 这 个 算式 是 不 是 等 于 求 出 F(X- b ) 
再 求 平方 ? 


签 : 不 对 ,这 是 两 个 不 同 的 算 
式 。E(X-h)? 表 示 先 求 所 有 结果 
的 平方 ， 再 求 期 望 ; 如 果 先 求 出 
E(X- 咱 )， 再 将 结果 平方 ， 就 会 得 
出 截然 不 同 的 答案 。 


从 技术 上 说 ， 你 算 的 是 E((X-b))， 
但 通常 不 这 么 写 。 






方 概 计算 公 实 了 下 ， 
Yar(x) = E(X -)a 


阅 : 那么 方差 低 的 老虎 机 和 方差 
高 的 老虎 机 有 何 区 别 ? 


等 : 方 着 高 的 老虎 机 表示 你 的 
整体 收益 变化 大 得 多 ， 整 体 上 的 记 
钱 数额 更 不 可 预期。 

一 般 说 来 ， 方差 越 小 ， 每 一 局 的 平 
均 政 益 就 越 接近 期 望 值 。 老 虎 机 的 
方差 超大 ， 整 体 收益 的 可 靠 性 越 低 。 





善 用 期 户 


和 下 面 是 随机 变量 X 的 概率 分 布 : 





链 习 x 1 2 3 4 |s 
P(X=x) |o1 |o25 |o3s Jo2 |o 
1. E(X) 是 多 少 ? 
2. Var(X) 是 多 少 ? 
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练习 解答 


下 面 是 随机 变量 X 的 概率 分 布 : 


1 2 [3 5 | 
[PXI [or |o25 |o35 Jo2 lo 


发生 
1. E(X) 是 多 少 ? 入 个 名 位 入 生生 入 
报 亩 相 泰 ， 央 


g 问 和 . 
560) = 了 xptx=x) 尼斯 有 有 素 种 
= 1x0.1 + 2x0.25 十 3x0.35 + 4x0.2 二 + 5x0.1 
一 0.7 十 05 十 1.05 十 0D.83 十 0.5 


一 2.95 


2. Var(X) 是 多 少 ? 
Var(X) = EX- pL) 
= Sw -bb)P(X=x) 
= (1~2.95)2x0.1 + {2-2.95)*x0.25 + .(3-2.95)?x0.35 + (4-2.95)7x0.2 + (5-2.95)?x0.7 
= (-1.95)?x0.1 + {~0.95)*x0.25 + (0.05)*x0.35 + {1.05)*x0.2 + (2.05)*x0.1 
= 3.8025x0.1 + 0.9025x0.25 + 0.0025x0.35 + 1.1025x0.2 + 4.2025x0.1 
= 0.38025 + 0.225625 + 0.000875 + 0.2205 + 0.42025 


= 1.2475 
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善 用 期 望 





案件 : 不 断 变化 的 期 户 

统计 邦 播放 过 许多 大 家 喜闻乐见 的 智力 竞赛 节目 ， 其 中 有 一 个 节目 叫 
做 “ 明 与 暗 ”， 规 则 是 这 样 的 : 向 参赛 者 出 示 几 个 盒子 ， 每 个 盒子 里 
装 有 不 同 数额 的 钱 ， 参 赛 者 必须 选择 一 个 盒子 ， 但 不 能 看 盒子 里 面 有 


5 种 什么 。 剩 下 的 盒子 会 一 个 接 一 个 打开 ， 每 打开 一 个 合子， 参赛 者 都 有 
机 会 进行 选择 : 留 下 原先 选择 的 盒子 中 的 钱 ( 不 能 看 ) ， 或 根 
准 理 据 装 在 其 余 未 打开 的 盒子 里 的 钱 的 总 额 另 得 一 份 奖金 。 根 据 参 





赛 者 得 到 的 奖金 ， 统 计 邦 海豹 保护 区 亦 会 得 到 一 笔 捐款 。 


最 近 的 一 位 参赛 者 是 一 名 业余 统计 师 ， 他 看 出 只 要 知道 所 有 售 
子 的 期 望 ， 就 能 增加 胜算 。 他 刚刚 算 完 期 望 ， 制 片 人 就 来 了 。 


“再 过 三 分 钟 你 就 该 上 场 了 ”， 制 片 人 说 ，“ 我 们 改过 所 有 盒子 里 的 
数额 了 ， 和 原来 相 比 ， 现 在 的 金额 差 10 美 元 就 翻 倍 。” 


参赛 者 惊慌 失措 地 瞪 着 制 片 人 ， 难 道 他 的 全 部 计算 都 泡汤 了 吗 ? 他 
不 可 能 在 三 分 钟 以 内 从 头 算出 期 望 。 他 该 怎么 办 ? 


这 位 参赛 者 如 何 才 能 以 前 所 未 有 的 速度 算出 新 的 期 望 ? 
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新 概率 分 布 


肥 息 改 了 价 码 


几 分 钟 前 ， 肥 和 蛋 改 了 老虎 机 的 赌 本 和 奖金 ， 下 面 是 
新 价 码 : 信 每 局 1 对 元 呈 到 每 局 2 盖 元 ， 






$$4$ = $00 
$$ 人 (任意 顺序 )=$75 
DBD -0 
GO 










老虎 机 每 一 局 ( 拉 一 次 杆 ) 的 赌 本 现在 从 1 美元 变 成 了 2 美 
元 ， 而 赢 金 翻 了 5 倍 。 要 是 赢 了 ， 就 能 捞 更 多 钱 了 。 


下 面 是 新 概率 分 布 


yz la la [7 lo | 
PE [os ooos oo [ooos [ooo | 





只 要 算出 期 望 和 方差， 就 能 知道 长 
期 的 收益 情况 . 
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善 用 期 毛 


愉 盈 动 乞 


新 概率 的 方差 和 期 望 是 多 少 ? 这 些 数 值 与 之 前 的 收益 分 布 期 
望 -0.77 和 方差 2.6971 相 比如 何 ? 


yy zl Ia ls 
oo |oo08 [oo0s |oon | 
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新 概率 的 方差 和 期 望 是 多 少 ? 这 些 数 值 与 之 前 的 收益 分 布 期 
望 -0.77 和 方差 2.6971 相 比如 何 ? 






















PCY= |0977 
E(Y) = (-2) x 0.977 + 23 x 0.008 + 48 x 0.008 + 73 x* 0.006 十 98x0.001 


一 -1.954 + 0.184 + 0.384 + 0.438 + 0.098 


= -0.85 





var(Y} = 5E(Y -hn)’ 
= ZY -uP(Y=y) 

= (~-2+0.85)*x0.977 + (23+0.85)?x0.008 + (48+0.85)*x0.008 + (73+0.85):x0.006 十 
《98 十 0.85)2x0.001 
= (-1.15)?x0.977 + {23.85)?x0.008 + (48.85)?x0.008 十 {73.85)2x0.006 + (98.85)2x0.001 
= 1.3225x0.977 + 568.8225x0.008 + 2386.3225x0.008 十 5453.8225x0.006 十 
9771.3225x0.001 
= 1.2920825 + 4.55058 + 19.09058 + 32.722935 + 9.7713225 


= 67.4275 


期 蛙 精 微 下 禾 了 一 点 几 ， 因 此 从 上 长 期 看 来 ， 我 们 急 局 可 拨 赔 0.85 医 元 ， 方 基 增 大 ， 这 总 示众 长 期 看 未 . 
我 们 有 可 能 在 这 台 老 虎 机 上 赔 更 多 的 钱 ， 但 确定 性 得 小 ， 





你 是 说 每 当 肥 备 赌 场 改 价 码 ， 我 们 就 
必须 重担 这 个 丰 素 的 计算 过 程 吗 ? 






新 旧 收 益 互 有 关联 。 


每 一 局 的 财 本 上 涨 到 2 美元 ， 赢 金 则 是 原来 的 5 倍 。 由 于 新 旧 收 
益 之 间 存 在 关系 ， 所 以 ， 也 许 它 们 的 期 望 和 方差 也 存在 关系 。 


让 我 们 找 出 这 种 关系 。 
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善 用 期 望 


将 妙 池 


现在 是 代数 时 间 。 你 的 任务 是 将 一 些 数 
字 从 奇妙 池 里 捞 出 来 ， 将 它们 放 入 
计算 式 中 的 空白 位 置 。 每 个 数字 
只 能 用 一 次 ， 但 不 需要 把 所 有 数 
字 都 用 上 。 目 标 : 根据 老虎 机 的 
旧 收 益 表 达 式 得 出 新 收益 表达 式 。X 
代表 旧 收 益 ，Y 代 表 新 收益 。 





X= ( 原 收益 ) - (新 赌 本 ) 
( 原 收益 ) ~ 

( 原 收益 ) a pe 

Y=5 ( 原 收益 ) - (新 赌 本 ) 
人 3( aoeaeeeeeeeeeee Se = Ooooreemeeeese 
=5 秆 
i i 


注意 : 从 池 里 捞 出 的 每 个 
计算 因子 只 能 用 一 次 
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奇妙 池 解 答 


疹 妙 池 解 答 


现在 是 代数 时 间 。 你 的 任务 是 将 一 些 数 
字 从 奇妙 池 里 捞 出 来 ， 将 它们 放 人 入 
计算 式 中 的 空白 位 置 。 每 个 数字 
只 能 用 一 次 ， 但 不 需要 把 所 有 数 
字 都 用 上 。 目 标 : 根据 老虎 机 的 
旧 收 益 表达 式 得 出 新 收益 表达 式 。X 
代表 旧 收 益 ，Y 代 表 新 收益 。 





X = ( 原 收益 ) - (新 赌 本 ) 
= ( 原 收益 )- 1 


( 原 收 益 ) = X + 1 


我 们 可 以 将 原 收 
pp <5 ( 原 收益 ) - (新 赌 本 ) 
X + 1 2 注 


(一 原 赌 夺 是 1 划 元 ， 
人 这 个 式 子 表示 基于 X 的 原 收 闪 ， 


= 5 x 村 。 沪 
omeootevesnesns Voomponetee st eevee ,入 所 ,1 Y=5X+3, 这 就 是 X 与 
Y 之 同 的 确定 关系 。 


注意 : 从 池 里 捞 出 的 每 个 
计算 因子 只 能 用 一 次 
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善 用 期 户 


EX) 与 E(Y) 之 间 存 在 线性 关系 


我 们 发 现 ， 新 收益 与 原 收益 可 以 通过 Y = 5X + 3 联系 起 来 ， 其 
中 ，Y 为 新 收益 ，X 为 原 收益 。 现 在 我 们 要 看 看 E(X) 与 E(Y) 之 
间 以 及 Var(X} 与 Yar(Y) 之 间 是 否 存在 某 种 关系 。 


如 果 存 在 某 种 关系 ， 我 们 就 能 在 肥 蛋 改 价 码 时 大 大 节省 计算 
新 期 望 和 新 方案 的 时 间 。 只 要 知道 新 结果 和 原 结果 之 同 的 关 
系 ， 我们 就 能 迅速 算出 新 期 望 和 新 方差 。 


~\ 芒 芭 世 





让 我 们 看 看 E(X) 与 E(Y) 的 关系 以 及 Var(X) 与 Var(Y) 的 关系 是 
否 有 某 种 固定 模式 。 


1 E(X) 等 于 -0.77，E(Y) = -0.85，5 X E(X) 是 多 少 ? 5 x E(X) + 3 是 多 少 ? 结果 与 E(Y) 有 何 关系 ? 








2.， Var(X) = 2.6971，Var(Y) = 67.4275，5 x Var(X) 是 多 少 ? 52 x Var(X) 是 多 少 ? 结果 与 Var(Y) 有 和 关系 ? 


3. 如 何 将 这 种 关系 推广 至 所 有 Y = aX + b 的 概率 分 布 ? 
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动 动笔 解答 


人 解 管 让 我 们 看 看 E(X) 与 E(Y) 的 关系 以 及 Var(X) 与 Var(Y) 的 关系 是 否 
有 某 种 国定 模式 。 


1. E(X) 等 于 -0.77，E(Y) = -0.85，5 x E(X) 是 多 少 ? 5 x E(X) + 3 是 多 少 ? 结果 与 E(Y) 有 何 关系 ? 
5 xE(X) = -3.85 



















5 x E(X) 十 3 一 -0.85 
E(Y) =5 x E(X) 十 3. 


2. Var(X) =2.6971，Var(Y) = 67.4275，5 x Var(X) 是 多 少 ? 52 x Var(X) 是 多 少 ? 结果 与 Var(Y) 有 和 关系 ? 


5 x Var(X) = 13.4855 
5*? x Var(X) = 67.4275 


Var(Y) = 5° x Var(X) 


3， 如 何 将 这 种 关系 推广 至 所 有 Y = aX + b 的 概率 分 布 ? 
E(aX 二 +b)=aEX)+b 


Var(ax + b) = a* var(x) 


老虎 机 变换 


你 在 前 几 页 完成 了 哪些 工作 ? 


首先 ， 你 求 出 X 的 期 望 与 方差 ， 这 里 的 X 代 表 你 在 每 一 局 中 有 
望 获得 的 收益 。 


然后 ， 你 想 知道 肥 蛋 的 价格 变化 会 造成 什么 结果 ， 但 不 想 完 
全 从 头 开始 计算 期 望 与 方差 ， 于 是 你 算出 新 收益 与 原 收益 之 
间 的 关系 ， 再 利用 这 种 关系 计算 新 期 望 与 新 方差 。 得 出 : 


E(5X + 3) = 5E(X) + 3 


Var(5X + 3) = 52Var(X) 
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善 用 期 望 


线性 变换 的 沉 周 公式 
我 们 可 以 将 以 下 公式 推广 至 任意 随机 变量 ， 若 随机 变量 
为 X: 一 一 如 生来-40， 涩 后 job 
E(aX + b) = aE(X) + b 
取 n 的 平方 ， 泰 以久 
; 差 (忽略 0) 
Var(aX + b) = azVar(X) “” 
这 就 是 所 谓 的 线性 变换 ， 因 为 X 发 生 的 是 线性 变化 一 即 
基础 概率 保持 不 变 ， 但 数值 变 为 新 值 ， 其 形式 为 : aX+b。 
世上 没有 俐 问题 
问 : ”a 和 b 必 须 是 常数 吗 ? 问 : ”我 必须 记 住 如 何 做 线性 变换 吗 ? 这 重要 吗 ? 


签 是 的 ， 如 果 a 和 b 是 变量 ， 那 么 以 上 结果 不 成 立 。 管 : ”是 的 ,很 重要 。 从 长 远 看 这 能 为 你 节省 时 间 ， 
不 必 数据 一 发 生变 化 ， 你 就 得 从 头 计算 概率 分 布 的 期 记 


阅 : 方差 中 的 b 哪 里 去 了 ? 和 方差 。 相 反 ， 你 可 以 将 已 经 算得 的 期 望 和 方差 代入 上 
式 ， 从 而 得 出 新 概率 分 布 的 期 望 和 方差 。 

答 : 在 概率 分 布 中 增加 一 个 常数 仅 对 期 望 有 影响 ， 

对 整个 方差 没有 影响 。 懂得 做 线性 变换 还 可 以 帮助 你 考场 得 意 ， 首先 ， 知道 简 


便 算 法 可 以 帮助 你 节约 时 间 ; 另外 ， 考 卷 上 不 一 定 会 给 
出 基础 概率 分 布 ， 你 的 已 知 条 件 可 能 是 变量 的 期 望 ， 你 
可 能 必须 根据 最 基本 的 信息 对 其 进行 变换 。 


在 变量 中 增加 一 个 常数 不 过 是 将 概率 分 布 移动 一 下 ， 分 
布 的 形状 依然 不 变 。 也 就 是 说 ， 期 望 以 b 为 幅度 进行 偏 

移 ， 但 由 于 形状 保持 不 变 ， 所 以 方差 也 保持 不 变 。 

| 问 : 我 从 头 到 尾 算出 了 期 望 和 方差 ， 结 果 却 是 错 的 ， 


闭 : 我 委 售 夺 方 差 会 乘 以 一 个 2， 这 是 为 什么 这 是 为 什么 2 


答 : 交 王 采 以 一 个 常数 意味 着 所 有 基础 数据 都 科 以 答 :体现 在 知道 了 吧 ， 计 算 期 望 和 方差 是 很 容易 出 


PM 错 的 。 如 果 按 照常 规 算法 ， 很 容易 不 是 这 里 错 ， 就 是 屠 
在 计算 方差 的 过 程 中 要 计算 各 基础 数据 的 平方 。 由 于 基 里 错 。 尽 量 使 用 统计 简化 算法 ， 这 样 效 果 会 好 一 些 。 
础 数据 都 乘 以 a， 因 此 最 终结 果 是 方差 乘 以 a2。 
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案例 解答 


破案 : 不 断 变化 的 期 望 
前 面 那 位 参赛 者 如 何 才能 以 前 所 未 有 的 速度 算出 新 的 期 望 ? 

5 分 钟 
参赛 者 惊慌 失措 地 左 顾 右 盼 了 一 会 儿 ， 接 着 释然 了 一 一 数值 的 


变化 毕竟 不 是 什么 大 问题 。 推 理 








参赛 者 已 经 花 了 一 些 时 间 算 出 所 有 盒子 中 的 原 有 数值 的 期 
望 ， 并 由 此 获知 有 多 少 钱 在 向 他 招手 。 

制 片 人 已 经 告诉 过 他 ， 新 奖金 比 原 奖金 的 2 倍 少 10 美 元 ， 也 就 是 说 ， 

这 是 一 个 线性 变换 。 如 果 用 X 代 表 原 奖金 ， 用 Y 代 表 新 奖金 ， 则 数值 变换 形式 
为 : Y=2X-10。 


参赛 者 用 E(2X-10)= 2E(X)-10 求 出 E(Y)， 也 就 是 说 ， 只 要 将 原 期 望 翻 倍 ， 


再 减 去 10， 就 能 求 出 新 期 望 。 Co 量 
一 -重要 统计 


由 果 你 有 一 个 变量 X， 同时 还 
有 数字 0 和 0， 则 : 

所 (QX 十 b) 三 naE(X) 十 
Var(a 义 十 Vb) = a2Var (X) 





概率 分 布 描述 了 一 个 给 定 变量 的 所 有 可 能 结果 的 ”em ” 当 变 量 X 按 照 aX+b 的 形式 发 生变 换 ( 其 中 a 和 b 都 是 
概率 。 常数 ) ， 则 为 线性 变换 ， 其 方差 和 期 望 计算 式 为 : 
期 望 即 所 期 望 的 长 期 平均 结果 ， 以 E(X) 或 b 表示 ， E(aX + b) = aE(X) +b 


计算 式 为 E(X) = 王 XP(X=X). Var(aX + b) = a?Var(X) 


X 的 函数 的 期 望 为 : E(f(X)) = Zf(x)P(X=x) 


概率 分 布 的 方差 算式 为 : Var(X)=E(X- py》 
概率 分 布 的 标准 差 算 式 为 : o =V Var(X) 
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善 用 期 拟 






这 人 么 说 风 果 我 起 多 玩 几 种 赌博 游戏 ， 通 
过 线性 变换 能 迅速 算出 戎 电 和 方 莽 ? 






使 用 线性 变化 和 多 玩 几 种 赌博 游戏 有 区 别 
进行 线性 变换 后 ， 所 有 的 概率 都 保持 不 变 ， 但 可 能 出 现 的 数值 发 生变 化 一 发 生 
变换 的 是 数值 而 非 概率 。 这 些 可 能 数值 的 数目 仍然 不 变 。 


如 果 多 玩 几 种 其 他 游戏 ， 则 数值 和 概率 都 发 生变 化 ， 就 连 可 能 数值 的 数目 也 会 发 
生变 化 。 这 时 不 可 能 只 对 数值 进行 转化 ， 而 概率 的 计算 会 迅速 变 得 错综复杂 


让 我 们 看 一 个 简单 的 实例 。 假 设 你 在 玩 一 台 非 常 简单 的 老虎 机 ， 概 率 分 布 为 X 








汪 TF 
PCX=m |o9 Jo | 
为 了 求 出 2X 的 概率 分 布 ， 只 需 将 X 乘 以 2， 由 于 潜在 和 2 里 鬼 教 值 条 "2， 
收益 翻 倍 ， 因 此 基础 数据 发 生 了 变化 。 泛音 保 箭 夭 灾 ， 
zx 2 1 
[| P(zX=zx) Jo9 Jor | 


如 果 想 在 这 台 老 虎 机 上 玩 两 局 ， 结 果 会 如 何 呢 ? 
你 需要 从 头 开始 计算 概率 分 布 ， 这 时 要 考虑 两 局 
赌局 可 能 出 现 的 所 有 结果 。 相当 于 次 软 ? 


b 果 两 局 输 则 =. 一 一 一 ve 收益 和 概 茸 


本 Te CE 
thm [Powew [om [ows foor | y= 


一 次 概率 和 数值 都 变 了 ， 那 么 我 们 该 如 何 求 出 一 
这 种 情况 的 期 望 与 方差 ? 
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认识 独立 观测 值 


每 一 次 拉杆 为 一 个 独立 观测 值 

在 赌博 机 上 连 现 多 局 赌局 时 ， 每 一 局 称 为 一 个 事件 .每 一 局 每 一 局 赂 局 称 为 一 个 

的 结果 称 为 一 个 观测 值 。 每 一 个 观测 值 具 有 相同 的 期 望 和 方 事件 每 一 局 赂 局 的 
9 


差 ， 但 观测 值 互 有 差别 ,不 可 能 每 一 局 的 政 益 都 一 样 。 


我 们 需要 用 某 种 办 法 对 不 同 赌局 或 观测 值 进行 区 分 ， 如 果 用 
X 人 氏 表 老虎 机 收益 的 概率 分 布 ， 则 把 第 一 个 观测 值 称 为 X, ， 把 


结果 称 为 一 个 观测 逢 
Te 








第 二 个 观测 值 称 为 X,。 
我 们 拘 戎 岂 和 方 瑟 
相同 ， 但 我 们 是 五 
未 桐 千 的 事件 。 
0 测 值 
第 观 油 
7 局 观测 七 ~ 9 党 2 局 


tC 
Xx, X, 


X, 和 X, 都 具有 和 X 一 样 的 概率 、 可 能 值 、 期 望 和 方差 ， 也 
就 是 说 ， 虽 然 它们 是 互 不 相干 的 观测 值 ， 并 且 结 果 也 不 同 ， 
但 它们 的 概率 分 布 相 同 。 








Px or |o 7 

这 就 是 我 们 鬼 概 率 分 市 的 来 历 ， A/ \ 
O 

or 1 ls | EEE EE CE 

P=x) [oo or | POG=x) |o9 jo 


我 们 希望 求 出 两 局 老虎 机 赌局 的 期 望 和 方差 ， 实 际 上 就 是 
要 求 X,*+X, 的 期 望 和 方差 ， 让 我 们 看 一 些 快速 算法 : 
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著 甲 期望 





观测 值 速 算法 
es a 
. X,+X, 并 不 等 于 
期 望 2X。 
普 先 状 让 六 二 关 ) 处 心 上 x,+ xX 表示 你 在 考虑 
Re 由 于 X, 和 X; 的 投放 : X 的 两 个 观测 值 ，2X 
E(X， X,} = E(X + E(X,) 沿 汪 X 的 概率 分 高 : pe : 表示 你 有 一 个 观测 值 ， 但 其 可 能 数 
=E(X)+E(X) ~ 6X) 和 E04) 都 等于 i 


= 2E(X) 
换 句 话 说， 如 果 我 们 已 知 两 个 观测 值 的 期 望 ， 则 将 E(X) 乘 以 2 即 
可 。 即 ， 如 果 要 在 E(X)=-0.77 的 老虎 机 上 玩 两 局 ， 则 相应 期 望 
为 -0.77x2 一 -1.54。 


测 值 ， 风 
我 们 可 以 将 整个 结论 推广 至 多 个 观测 值 ， 若 我 们 想 求 出 a 个 观测 pa A 
值 的 期 望 ， 则 可 按 下 式 计算 : 


E(X + X, + -… X) = nE(X) 


方 孝 


那么 Var(X, + X,) 又 如 何 计算 呢 ? 下 面 是 计算 方法 : 


Var(Xi + X,) = Var{X) + Var(X,) 
. 迷 x 的 模 昔 今 布 ， 国 


= Var(X) + Var(X) 所 一 一 由 于 X, 和 X: 沿 mr (NS 名 var(x) 相 周 . 


) 和 v 
= 2Var(X) Ware 


也 就 是 说 ， 如 果 我 们 在 Var(X) = 2.6971 的 老虎 机 上 玩 两 局 ， 则 方差 
为 2.6971 x 2 二 5.3942。 


我 们 可 以 将 整个 结论 推广 至 任何 数目 的 独立 观测 值 。 如 果 有 X 的 n 个 
WW。 
独立 观测 值 ， 则 : arb 来 忆 纲 测 值 的 数 


Var(X + X + … X) = nVar(X) 


也 就 是 说 ， 为 了 求 出 多 个 观测 值 的 期 望 和 方差 ， 只 要 用 观测 值 的 数目 乘 
以 E(X) 和 Var(X) 就 行 了 。 
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世上 没有 傻 问 题 


问 : 难道 E(X+X:) 与 EL2X) 不 一 样 ? 
答 : 看 似 相 似 ， 其 实 不 然 ， 它 们 
是 两 个 概念 。 


如 果 是 E(2X)， 划 表示 你 想 将 一 个 变 
量 的 基础 教 据 翻 必 ， 然 后 求 其 期 户 


和 方差 。 也 就 是 说 ， 实 量 只 有 一 个 ， 


但 数值 变 为 两 倍 。 

如 果 是 E(X+X)， 则 表示 你 观测 到 了 
X 的 两 个 独立 结果 ， 需 要 求 其 综合 期 
望 。 例 如 ， 如 果 X 代 表 一 局 赌局 的 概 
率 分 布 ， 则 XI+X; 代 表 两 局 游戏 的 概 
率 分 布 。 


要 克 





”概率 分 布 描述 了 一 个 给 定 随 机 变量 的 所 有 可 


能 结果 的 概率 。 


as 一 个 随机 变量 X 的 期 望 等 于 我 们 所 期 望 的 长 期 平 
均值 ， 以 E(X) 或 bp 表示 。 计 算式 为 ; 


E(X) = ExP(X=x) 


一 个 随机 变量 X 的 方差 计算 式 为 : 
Var(X) = E(X- py¥ 
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世上 没有 傻 问 题 
问 ; ”这么 说 X 和 X,; 是 一 样 的 ? 


答 : 它们 的 概率 分 布 相 同 ， 但 
它们 本 身 是 不 同 的 结果 (或 者 说 观测 
值 )。 例 如 ，X, 可 以 指 第 1 局 ，X; 指 
第 2 局 ， 它 们 具有 相同 的 概率 分 布 ， 
但 实际 结果 可 以 不 一 样 。 


阅 ;我 发 现 新 方差 是 nvarbg， 而 不 
是 像 线性 变换 的 结果 一 样 是 nzVar(X)， 
这 是 为 什么 ? 











重要 统计 星 
狼 立 观测 值 


使 用 下 列 公 苹 计 算 其 方差 ， 
EC 十 Xz 十 十 Xn) = wE(X) 


Var(X, + Xaz 十 .… 十 xX) = wvar0d) 


答 ;， 这 一 次 我 们 有 一 系列 的 独 
立 观测 值 ， 这 些 观测 值 都 有 相同 的 
概率 分 布 ， 于 是 我 们 可 以 将 所 有 观 
测 值 的 方差 相 加 ， 求 出 整个 方差 ， 
如 果 有 n 个 独立 观测 值 ， 则 结果 为 
nVar(X)。 


在 计算 方差 Var(nX) 时 ， 我 们 将 基础 
教 据 弱 以 ， 由 于 方差 是 通过 取 基 础 
数据 的 平方 得 到 的 ， 因 此 所 求 方 差 
为 nz?Var(X)。 


标准 差 是 方差 的 平方 根 。 


@” 当 一 个 随机 变量 从 X 变 换 为 aX+b 时 ， 则 为 线性 


式 为 : 


变换 ， 其 中 a 和 b 均 为 常数 。 其 期 望 和 方差 计算 


E(aX + by = aE(X) +b 


Var(aX + b) = a2Var(X) 





善 用 期 户 


是 线性 受 焰 ， 
迹 龙 独 冬 观测 值 ? 


下 面 是 一 系列 实例 ,假定 已 知 每 个 X 的 概率 分 布 ， 你 的 任务 是 说 出 
可 以 通过 哪 种 方法 解决 各 个 问题 : 是 线性 变换 ， 还 是 独立 观测 值 ? 


线性 变换 独立 观测 值 


一 杯 超大 杯 咖 哗 的 别 呼 量 ，X 是 匣 
通 杯 史 呼 的 秽 呼 王 。 口 口 


每 天 争 喝 一 栎 咖啡 : 闪 是 一 杯 血 哗 


的 王 。 LL] 口 


朱 容 10 允 有 影 林 的 净 收 益 ; 是 呈 一 
张 亲 标的 净 牧 益 。 


求 闲 票 价格 上 潍 后 每 闫 一 张 影 村 
的 净 收 益 ， 欠 是 买 一 号 彩票 的 闫 
收益 。 


多 买 一 只 母 鸡 ， 种 它 下 爱人 敌 蛙 
具 ; 是 某 个 品种 了 的 网 每 网 的 产 
颁 嫩 。 
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线性 变化 或 独立 观测 值 解决 方案 


龙 线 性 交换 ， 
和 迹 龙 独 点 疯 济 值 ? 
解 蔷 


下 面 是 一 系列 实例 ， 假 定 已 知 每 个 X 的 概率 分 布 ， 你 的 任务 是 说 出 
可 以 通过 哪 种 方法 解决 各 个 问题 : 是 线性 变换 ， 还 是 独立 观测 值 ? 












线性 变换 















一 杯 越 大 杯 咽 哗 的 和 哗 量 ; 闪 四 次 


通 杯 徊 只 的 惫 只 全 。 Th 口 
夭 天 台电 一 杯 嘟 啡 ，X 是 一 杯 咖 吴 
2 口 如 






求 呈 10 怠 彩 采 的 淆 收益 ; X 亚 呆 一 

张 影 时 的 净 收 益 。 < 口 wh 
备 买 一 张 彩 村 鬼 收 茂 与 
是 否 购 买 其 他 彩 娄 无关 ， 

来 影 标价 格 上 游 后 每 只 一 叱 影 村 

的 净 收 益 : X 是 办 一 叱 影 标的 闫 收 -二 图 


宁 票 价格 改变 则 期 望 收 部 改 


庆 - 一 一 人 妈 ， 但 收益 报 率 不 变 ， 思 此 


可 以 通 这 线性 变换 解答 . 
多 妥 一 只 母 鸡 ， 训 了 它 下 鼻 侯 乎 I 


过 ; 种 革 不 品种 的 鸡 每 于 的 产 
口 td 
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本 地 餐厅 正在 摘 促销 活动 ， 每 块 棋 饼 售 价 0.50 美 元 ， 并 藏 有 一 条 神秘 信息 。 大 部 分 
信息 都 不 过 是 预 祝 购买 者 前 程 似 锦 ， 但 还 有 一 部 分 却 表 示 可 为 哆 瞧 打折。 折扣 2 美元 
的 概率 是 0.1， 折 扣 5 美 元 的 概率 是 0.07 ， 折 扣 10 美 元 的 概率 是 0.03 。 





如 果 X 为 顾客 的 净 收 益 ， 那 么 X 的 概率 分 布 如 何 ? E(X) 和 Var(X) 等 于 多 少 ? 


餐厅 决定 将 糕饼 价格 调 高 1 美元 ， 新 的 期 望 和 方差 是 多 少 ? 
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练习 解答 


本 地 餐厅 正在 搞 促销 活动 ， 每 块 糕饼 售 价 0.50 美 元 ， 并 藏 有 一 条 神秘 信息 。 大 部 分 


锥 刁 信息 都 不 过 是 预 祝 购买 者 前 程 似 锦 ， 但 还 有 一 部 分 却 表示 可 为 晚餐 打折 。 折 扣 2 美元 
饰 营 的 概率 是 0.1， 折 扣 5 美 元 的 概率 是 0.07， 折 扣 10 美 元 的 概率 是 0.03 。 


如 果 X 为 顾客 的 净 收 益 ， 那 么 X 的 概率 分 布 如 何 ?”E(X) 和 Var(X) 等 于 多 少 ? 
下 面 是 X 购 氢 率 分 布 ， 





E(X) = {-0.5)x0.8 + 1.5x0.1 十 4.5x0.07 + 9.5x0.03 
一 -0.4 十 D.15 + 0.315 + 0.285 
= 0.35 

Var{x) = EX- 1) 

Dk- 1)P=n) 


= (-0.5-0.35)*x0.8 十 (1.5-0.35)2x0.1 + (4.5~0.35)*x0.07 + (9.5-0.35)*x0.03 


四 


= (-0.85)?x0.8 十 【1.15)2x0.1 十 (4.15)2x0.07 + (9.15)*x0.03 
= 0.7225x0.8 十 1.3225x0.1 + 17.2225x0.07 + 83.7225x0.03 
= 0.578 + 0.13225 + 1.205575 + 2.511675 
= 4.4275 
餐厅 决定 将 糕饼 价格 调 高 1 美元 ， 新 的 期 望 和 方差 是 多 少 ? 
餐厅 将 糕 悄 价格 调 高 了 0.5 肥 元， 即 新 此 歼 收益 袖 和 型 为 - 0.5: 
E(X-0.5) = EX) -0.5 
= 0.35-0.5 


= -0.15 


var(X -0.5) = var(x)} 


= 4.4275 
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新 老虎 机 在 等 你 


肥 蛋 赌场 买 进 一 台新 式 老 虎 机 ， 赌 本 更 大 ， 奖 金 更 高 。 
下 面 是 这 台新 老虎 机 的 概率 分 布 : 


ss 
四 ， 个 过 ， 


下 全 吧 | 


我 们 已 经 讲 过 单 玩 一 台 老 虎 机 的 期 望 和 方差 ， 也 讲 过 在 同一 
台 老 虎 机 上 连 玩 儿 局 的 期 望 和 方差 .， 那么， 要 是 在 两 台 老 虎 
机 上 玩 两 局 呢 ? 


在 这 种 情况 下 ,两 台 老虎 机 有 两 种 各 自 独立 、 互 不 相同 的 


概率 分 布 : 

区 

PCX=x) |o99 Joo | 老虎 机 的 当前 收益 。 

ly |:2 |23 |48 |73 |9s | 

IP(Y=y) |o977 |ooo8 |oo0o8 |ooo6 |ooo | Te 二 的 光 席 
我 们 该 怎么 求 在 两 台 老 虎 机 上 各 玩 一 局 的 期 望 和 方差 呢 ? 的 当前 小 站， 






我 们 可 以 求 出 X+ 丫 的 概率 分 布 ， 不 过 那 
样 太 费时 间 ， 而 且 有 可 能 出 差错 。 我 在 
想 有 没有 别 的 捷径 可 走 ? 
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夭 机 变 瘟 加 减 计算 


EX) + ECY) = E(X + Y) 


我 们 希望 求 出 在 每 台 老 虎 机 上 各 玩 一 局 的 期 望 和 方差 ， 即 希望 求 出 
E(X + Y) 和 Var(X + Y)， 其 中 X 和 Y 为 代表 两 台 老 虎 机 的 随机 变量 ，X 
和 Y 相 互 独立 。 


实现 此 目的 的 一 个 方法 是 算出 X+Y 的 概率 分 布 ， 然 后 计算 期 望 和 方差 。 


别 担心 ， 我 们 不 是 要 体 算 这 个 ， 和 和 
家 
幸亏 我 们 不 必 这 人 么 佑 。 只 要 将 E(X) 和 E(Y) 相 加 ， 就 能 求 出 
E(X + Y)。 E(X + Y) = E(X) + E(Y) 
意义 显而易见 ， 饮 如 ， 如 果 你 玩 两 局 ， 一 局 有 望 赢 5 美 
元 ， 另 一 局 有 望 赢 10 美 元 ， 则 总 体 上 有 望 赢 5 美元 +10 美 
元 =15 美 元 。 Var(X + Y) = Var(X) + Var(Y) 


类 似 地 可 以 求 出 方差 ， 只 要 将 两 个 方差 相 加 即 可 。 对 于 所 
有 独立 随机 变量 来 说 ， 这 些 结论 全 都 成 立 。 


E(X + Y) 
E(X) SE 
E 
y 2 
中 
0 0 Ey 0 入 一 一 
Var(X) Var(V) Var(X + Y) 
态 姑 址 大 ， 术 上 齐 
分 市直 化 盐 大 。 
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如 果 X 和 Y 相 互 不 独 
立 ， 则 Var(X+Y) 不 
再 等 于 Var(X) + Var(Y)。 


善 用 期 望 


E(X)-E(Y)= EX - Y¥) 


随机 变量 不 仅 能 相 加 ， 还 能 相 减 ， 这 时 不 是 X+Y， 而 是 
X=Yo 
如 果 面 对 的 是 两 个 随机 变量 的 差 ， 就 很 容易 求 出 期 望 


E(X - Y) = E(X) - E(Y 
E(X-Y)， 只 要 用 E(X) 减 去 E(Y) 即 可 。 ( ) 0 (人 


X-Y 的 方 益 Var(X-Y) 则 不 那么 直观 -一 为 了 求 Var(X-Y)， Var(X - Y) = Var(X) + Var(Y) 


需要 将 两 个 方差 加 起 来 。 
要 将 方 莽 相 加 ， 路 心 哦 | 









但 这 似乎 不 好 解释 ， 若 将 两 个 随机 变 
为 什么 要 把 方 卷 加 起 量 相 减 ， 则 方差 
来 呢 ? 
要 相 加 。 
猛 一 看 ， 这 个 算法 
这 是 因为 变异 性 增 大 了 。 有 违 直观 ， 因 此 很 容易 搞 错 。 切 
记 : 如 果 两 个 变量 是 独立 变量 ， 则 
若 我 们 用 一 个 随机 变量 减 另 一 个 随机 变量 , 概  : 
率 分 布 的 方差 依然 增 大 。 Var(X - Y) = Var(X) + Var(Y) 
E(X) 
' by E(X -~ Y) 
省 冯 亿 各 个 变 重 做 减法 
9 全》 0 《> ee 
Var(X) Var(Y) Var(X - Y) 


独立 随机 变量 做 减法 运算 ， 广 差 


将 两 个 相互 独立 的 随机 变量 相 减 后 的 方差 与 将 两 个 变量 相 
加 后 的 方差 是 一 模 一 样 的 ， 变 异性 只 会 增加 ， 不 会 减少 。 依然 增 大 。 
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线性 变 辕 加 减 


线性 变换 也 可 以 做 加 疹 运 算 

事情 还 没有 结束 ， 像 随机 变量 加 减 运算 一 样 ， 线 性 变换 也 可 以 做 加 丰 
运算 。 

假设 出 现 这 种 情况 ， 肥 看 赌场 更 改 了 两 台 老虎 机 ( 甚至 只 是 其 中 一 台 老 
虎 机 ) 的 冉 本 和 奖金 ， 我 们 最 后 需要 做 的 是 ， 算 出 整个 概率 分 布 ， 以 便 


求 出 新 的 方差 和 期 望 。 
真 走运 ， 我 们 可 以 用 另 一 种 简便 算法 。 X 一 > aX 
假设 X 和 Y 老 虎 机 的 收益 恋 了 ， 使 得 X 的 收益 为 aX,，Y 的 收益 为 bY， 其 中 Y —» bY 
a 和 b 为 任意 数字 。 
为 了 求 出 aX 和 bY 这 两 个 组 合 的 期 望 和 方差 .可 以 使 用 以 下 简便 算法 : Q 和 b 可 为 值 意 数字 
3X 与 bY 相 加 
为 了 求 出 aX + bY 的 期 望 和 方差 ， 可 使 用 下 列 算 式 : 

E(aX + bY) = aE(X) + bE(Y) 

Var(aX + bY) = a:Var(X) + bzVar(Y) 
如 前 所 述 ， 由 于 是 线性 变换 ， 所 以 取 数 字 的 平方 。 这 是 线性 变换 ， 

所 以 这 里 用 和 平方。 

BX 与 bY 相 减 
若 将 随机 变 凑 相 减 并 计算 EtaX-bY) 和 Var(aX- bY)， 
可 使 用 下 列 算式 : 

E(aX - bY) = aE(X) - bE(Y) 

Var(aX - bY) = a2Var(X) + b:Var(Y) 
如 前 所 述 ， 邯 使 随机 变量 做 减法 ， 方 差 仍然 做 加 法 。 切记 将 方 基 相 加 . 

J 
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阅 ; 如 果 x 和 Y 代 表 周 局， 那么 
axX+bY 是 表示 “a 局 X 姥 局 +b 局 Y 赌 局 ” 吗 ? 


答 : :x+by 其 实 是 表示 两 个 线性 
变换 相 加 ， 换 句 话说 ，X 和 Y 的 基础 
数据 变 了 ， 这 与 独立 观测 值 不 一 祥 ， 
对 于 独立 观测 值 来 说 ， 每 一 局 都 是 一 
个 独立 观测 值 。 


阅 ; 我 看 不 出 什么 时 候 会 用 到 
x - Y。 这 能 达到 什么 目的 呢 ? 


签 :在 你 希望 求 出 两 个 变 重 的 差 
时 ，X-Y 的 确 十 分 有 用 。PE(X-Y) 有 
点 几 像 在 说 “你 所 期 望 的 X 与 Y 的 差 
别 ”， 而 Var(X-Y) 则 指出 方差。 


让 





世上 没有 傻 问题 


间 :为 什么 把 X - Y 的 方差 加 起 
来 ? 你 肯定 应 该 做 减法 吧 ? 


答 : 
当 你 用 一 个 变量 减 另 一 个 变 重 时 ， 其 
实 变异 性 是 增 大 的 ， 因 此 方差 也 增 
大 。 变 量 相 减 的 变 开 性 与 变量 相 加 的 
变异 性 其 实 是 一 样 的 。 


还 有 一 种 理解 方法 : 计算 方差 时 会 


取 基 本 数值 的 平方 ，Var(X+bY) 等 于 
Var(X)+b’Var(Y)， 如 果 b= 二 -1， 则 
得 出 Var(X-Y)， 由 于 (-1)2=1， 
Var(X-Y) = 


因此 
Var(X) + Var(Y)。 


疾 一 看 这 有 违 直 党 ， 不过， 管 : 


善 用 期 望 


阅 :。 如 果 x 和 Y 相 互 不 独立 ， 还 能 
这 么 计算 吗 ? 


不 行 ， 只 有 在 X 和 Y 相 互 独立 
时 才能 这 么 做 ， 和 如果 要 求 相关 的 X +Y 
的 方差 。 则 必须 从 头 计 算 概率 分 布 。 


问 :似乎 X+X.: 的 规律 也 同样 适用 
于 X+Y， 对 妈 ? 


答 : 对 的 ， 只 要 X、Y、XIi 及 X; 相 
互 独立 就 行 。 





X 的 独立 观测 值 与 X 不 同 ， 每 个 观测 值 都 具有 相同 的 
概率 分 布 ， 但 结果 各 不 一 样 。 


Xn 是 X 的 独立 观测 值 ， 则 : 


Var(X + Y) = Var(X} + Var(Y) 
Var(X - Y) = Var(X) + Var(Y) 


X40Y 的 线性 变换 和 的 期 望 和 方差 用 下 列 各 式 进行 计算 : 
E(ax + bY) = aE(X) + bE(Y) 

E{aX - bY) = aE{X} - bE{Y) 

Var(aX + bY) = a2Var(X) + b2Var(Y) 


如 果 X1， X2， see 


E(X, + X, + .+X)= NE(X) 
Var(Xi + X + … Xi = NnVar(X) 


Var(aX - bY) = a2Var(X) + b2Var(Y) 


如 果 X 和 Y 是 独立 随机 变 醒 ， 则 : 


E(X + Y)=E(X) + E(Y) 
E(X - Y) = E(X) - E(Y) 
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期 望 与 方差 练习 


干 表 中 有 一 些 期 望 和 方差 ， 请 写 出 其 计算 公式 或 简便 算法 ， 必 剖 时 假定 变量 为 独立 变量 。 





Var(aX + b) 


E(X) 


< 


盖 | 
< 
| 
| 
EE Ee 
Ez Ee 
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普 用 期 望 





4 习 的 消费 概率 分 布 如 下 : 


某 家 餐厅 备 有 两 份 菜单 ， 一 份 是 周末 菜单 ， 一 份 是 平日 菜单 。 每 份 菜单 有 四 种 定价 ， 就 餐 者 
TH [x fo [1s lz [zs | 
PX=x) |o2 Jos jo lor | 
30 _ 
[005 _ 


你 会 期 望 谁 给 餐厅 带 来 最 大 营业 额 : 周末 20 位 用 餐 者 ， 还 是 平日 25 位 用 获 者 ? 
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站- 二 名 
条 一 


pg 


解答 


236 深入浅出 统计 学 


A 下 表 中 有 一 些 期 望 和 方差 ， 请 写 出 其 计算 公式 或 简便 算法 ， 必 要 时 假定 变量 为 独立 变量 。 
嫌 习 















区 用 期 波 


某 家 餐厅 备 有 两 份 菜单 ， 一 份 是 周末 菜单 ， 一 份 是 平日 菜单 。 每 份 菜单 有 四 种 定价 ， 就 餐 者 
的 消费 概率 分 布 如 下 : 


8 x 0 5 | 
PX=x) Jo2 Jos |o2 | 
20 | 


你 会 期 望 谁 给 餐厅 带 来 最 大 营业 额 : 周 示 20 位 用 餐 者 ， 还 是 平日 25 位 用 餐 者 ? 
让 我 们 先 事 测 平日 和 周 本 胸 期 再 。X 代 表 平 日 用 获 者 ，Y 代 表 周 二 用 天 者 ， 
€%) = 10x0.2 十 15x0. + 20x0.2 十 25x0.7 

一 2 十 7.5 十 4 十 2.5 
一 16 
€(Y) 一 15x0.15 + 20x0.6 + 25x0.2 + 30x0.05 


一 2.25 十 12 十 5 十 7 了 .5 


一 20.75 


条 一 位 用 餐 者 是 一 个 独立 观测 值 ， 鸭 了 求 出 筷 一 类 用 餐 者 的 用 瞎 金 蜂 ， 我 们 用 期 
笛 箭 以 访 关 用 大 者 负数 重 . 


25 们 用餐 者 在 平日 用 餐 ， 则 :， 25xE(X) = 25x16 = 400 
20 使 用 卷 者 在 周末 用 餐 ， 则 :，20xE(Y) = 20x20.75 一 415 


这 说 明 ， 我 们 能 郝 期 望 ，20 位 周 未 用餐 者 支付 网 餐 商 高 于 25 位 平日 用 餐 者 支付 拘 
餐 喝 。 
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你 当 上 了 期 望 专家 ! 


发 了 ! 


通过 学 习 本 章 你 颇 有 斩获 ， 你 学 会 了 
用 概率 分 布 、 期 望 、 方 差 预测 自己 能 
在 某 台 老虎 机 上 赢 多 少 钱 。 









你 还 发 现 了 如 何 用 线性 变换 和 独立 观 
测 值 预测 在 收益 结构 发 生变 化 时 或 在 蕊 
同一 台 老 虎 机 上 多 次 赌博 时 有 望 赢得 恬 
的 奖金 . 
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状 攻 期 望 


山姆 有 两 家 喜欢 去 的 餐厅 ， 和 餐厅 A 一 般 比 餐厅 B 贵 ， 但 食物 品质 一 般 好 得 多 。 


下 面 的 两 组 概率 分 布 描述 了 山姆 在 每 家 餐厅 的 消费 意愿 ， 一 般 说 来 ， 你 觉得 两 家 餐厅 价格 差 
别 如 何 ? 差别 的 方差 是 多 少 ? 





FA [x la [0 lo [a | 
pm [os lo lo [or | 

FB [lo [5 le | 
wm [os lo | 
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练习 解答 


山姆 有 两 家 喜欢 去 的 餐厅 ， 餐 厅 人 一 般 比 餐厅 B 贵 ， 但 食物 品质 一 般 好 得 多 。 


习 下 面 的 两 组 概率 分 布 描述 了 山姆 在 每 家 餐厅 的 消费 意愿， 一 般 情 况 下 ， 你 觉得 两 家 餐厅 价格 
解答 。。 差 8 如何 ? 差别 的 方差 是 多 少 ? 
人 FA [x [zo | Js 14 | 
PCX= |o3 |o4 Joz To 
FB [|y | ls fe | 
PlY=w Jo2 Jos lo | 
让 我 们 先 算 X 和 Y 的 期 畦 和 方 基 ， 


E(X) = 20x0.3 + 30x0.4 + 40x0.2 + 45x0.1 E(Y) = 10x0.2 + 15x0.6 + 18x0.2 


二 6 十 12 十 8 十 4.5 一 2 十 9 十 3 了 .6 


一 30,5 一 1 和 .6 


var(X) = 《20-30.5$)jzx0.3 + (30-30.5)2x0.4# 十 Var(Y) = (10-14.6)zx0.2 + (15~14.6)*x0.6 十 


{40-30.5)*x0.2 十 (45-30,5)*x0.1 (18-14.6)?x0.2 


= (-10,.5)*x0,3 十 【-0.5)zx0.4 十 9.5:x0.2 十 14.52x0.1 = (-4.6)*x0.2 + 0.42xD0.6 + 3.4:x0.2 


= 110.25x0.3 + 0.25x0.4 + 90.25x0.2 十 210.25x0.f 一 21.16x0.2 十 0.16x0.6 十 了 1.56xD.2 


一 33.075 十 0.1 十 18.05 + 21.025 = 4.232 十 0.096 十 2.312 


= 72.25 一 6.64 
X 和 下 网 状 可 以 用 模型 X- 丫 表示 。 
EX-Y) = E00) - E(Y) Var 以 -站 ) = vart) + var(Y) 
= 30.5 -14.6 一 72.25 十 6.64 
一 15.9 = 78.89 
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6 排列 与 组 合 


。 排序 、 排 位 、 排 ， 


看 我 一 个 个 谍 过 去 ， 迟早 会 
找到 汤 将 和 被 身 店 风 号码， 





顺序 有 时 很 重要 。 

一 一 清点 某 些 事物 的 所 有 可 能 排序 方法 耗 时 颇 巨 ， 可 这 却 是 计算 某 些 
概率 必 不 可 少 的 过 程 一 麻烦 就 在 这 里 。 在 本 章 中 ， 我 们 将 介绍 推导 
出 这 类 信息 的 简便 方法 ， 为 你 免除 清点 一 切 可 能 结果 的 烦恼 。 来 吧 ， 
让 我 们 看 看 如 何 计算 概率 。 


进入 新 的 篇 章 
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进入 赛 道 


统计 孝 德 比 杯 马 赛 


统计 邦 德比 杯 马 赛 是 统计 邦 最 重要 的 一 项 体育 赛事 ， 来自 四 面 八方 
的 骑 师 和 他 们 品种 各 异 的 爱 马 将 在 这 里 一 较 高 下 ， 你 可 以 对 比赛 结 
果 下 注 。 要 是 能 押 中 每 场 比赛 的 前 三 名 ， 大 把 钞票 就 到 手 了 


开幕 赛 在 新 马 之 间 进 行 ， 参 加 比赛 的 都 是 一 些 初次 进军 赛场 的 嫩 
马 ， 因 此 ， 没 有 前 期 比赛 的 统计 量 用 以 预测 马匹 的 表现 。 也 就 是 
说 ， 你 必须 假定 每 一 匹 马 都 有 相同 的 得 胜 几 率 ， 这 可 以 归结 为 简 
单 概率 问题 。 

当天 的 第 一 场 比赛 是 三 马赛 。 比 赛 即 将 开始 ， 德 比 马场 开始 接受 下 
注 。 你 从 肥 和 蛋 赌场 赢 了 500 美 元 ， 正 好 可 以 在 德比 马场 花 掉 。 只 要 
能 押 中 三 匹 马 的 最 终 排名 ， 赔 率 可 达 7 : 1， 即 赌 本 翻 7 倍 : 可 获 
3500 美 元 。 


我 们 该 下 注 吗 ? 让 我 们 先 求 出 几 个 概率 再 做 决定 不 迟 。 





娘 率 15:1 表 示 奖 金 
是 赌 去 的 15 倍 |/ 
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想 开 心 一 下 ? 只 要 对 概率 略 
知 一 二 ， 你 会 得 心 应 手 的 。 


排序 、 排 位 、 排 


三 马赛 正在 进行 


第 一 场 比赛 在 三 匹 马 之 间 展 开 ， 十 分 简单 直接 。 一 心 赢 大 钱 的 你 
需要 预测 马匹 的 最 终 排名 ， 下 面 是 参加 比赛 的 三 匹 马 。 





比赛 结果 有 几 种 可 能 ( 假定 没有 平局 且 每 一 匹 马 都 跑 完 比赛 ) ? 
押 中 正确 结果 的 概率 是 多 大 ? 










计算 该 赌局 的 期 望 收益 。 


代打 未 ， 末 大 芝 种 祷 达 祖坟 
率 分 布 ， 然 后 计算 期 彰 
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Re 动 动 区 


、 解 管 比赛 结果 有 几 种 可 能 ( 假定 没有 平局 且 每 一 匹 马 都 跑 完 比赛 ) ? 
押 中 正确 结果 的 概率 是 多 大 ? 
计算 该 赌局 的 期 望 收 益 。 
比赛 结果 有 6 种 可 能 : 


单 和 看, 接 托 , 福 福 
音 看 , 福 福 , 拉 托 
接 托 , 音 看 , 福 福 
接 托 , 福 福 , 宕 看 
福 福 , 界 看 , 接 托 
福 福 , 拉 托 , 音 香 











没 错 ， 你 可 以 期 电 这 一 注 能 
收入 168 韶 元 ， 但 还 有 有 5/6 网 
时 候 是 马场 在 赢 。 你 还 觉得 
自己 很 幸运 吗 ? 


因此 ， 押 中 正确 排名 次 概率 为 1/6. 


押 上 500 盖 元 赌 示 ( 赔 率 7:1) 后 可 以 期 望 得 到 的 收益 的 概率 分 布 为 : 


三 马 案 


P(X=x) |o.833 
E(X) 一 一 500x0.833 十 3,500x0.167 


一 168 


盘 比 一 局 这 样 的 比赛 ， 我 们 可 以 期 望 收 入 168 最 元 ， 









三 马赛 ? 可 能 存在 这 种 比赛 
吗 ? 大 多 数 情况 下 都 是 群 马 
午 发 。 






确实 ， 大 多 数 比赛 的 参赛 马匹 都 不 止 三 匹 。 

我 们 需要 找 出 一 个 便捷 的 方法 ， 通 过 这 个 方法 ， 无 论 参 加 比赛 的 马匹 数目 是 
多 少 ， 都 能 求 出 马匹 的 最 终 排 名 有 多 少 种 可 能 。 

求 三 匹 马 最 终 排 名 状况 的 方法 十 分 简单 明了 ， 因 为 只 有 6 种 可 能 局 面 。 现 在 
的 麻烦 在 于 ， 参 加 比赛 的 马匹 越 多 ， 了 逐个 写 出 最 终 排名 的 难度 越 大 ， 所 花费 
的 时 间 越 多 。 

让 我 们 仔细 观察 参加 比赛 的 三 匹 马 的 各 种 排名 方式 ， 看 看 是 否 有 某 种 固定 模 
式 。 为 此 我 们 可 以 一 个 一 个 地 对 名 次 进行 考虑 。 
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排序 、 排 位 、 排 







马 儿 们 有 人 儿 种 穿越 终点 线 的 方式 ? 3 种 方式 


让 我 们 先 看 第 一 名 。 

肯定 有 一 匹 马 会 成 为 冠军 ， 三 匹 马 中 的 任意 一 匹 
都 有 此 可 能 。 也 就 是 说 ， 占 据 第 一 名 位 置 的 方式 
有 三 种 。 


穿越 终点 线 ， 三 区 条 


[一 有 可 能 赢得 这 人 


2 种 方式 
第 二 名 是 怎么 个 情况 呢 ? 2 
已 经 有 一 苞 马 邓 完 


区 和、 了 比赛 ， 那 么 只 利 


Fon- ww 
册 区 轧 失 第 二 名 8g 


如 果 已 经 有 一 匹 马 跑 完 了 比赛 ， 那 么 还 剩 下 两 匹 
马 ， 其 中 之 一 会 成 为 第 二 名 。 即 ， 占 据 第 二 名 位 
置 的 方式 有 二 种 ， 这 与 跑 第 一 名 的 马匹 无 关 。 


当 有 两 匹 马 跑 完 比 赛 后 ， 只 剩 下 一 个 位 置 留 给 “天 下 过 区 马 还 
有 了 忠 完 全程， 因此 


最 后 一 匹 马 一 第 三 名 。 留 丛 它 的 只 有 一 个 Tn 2 
| 


位 置 ， 第 三 名 ., 


这 对 我 们 计算 所 有 可 能 出 现 的 最 终 排名 有 何 帮 
助 呢 ? 
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排序 、 排 位 、 排 .….… 


计算 排 位 数目 


前 面 讲 到 ， 第 一 名 有 三 种 占据 方式 ， 每 一 种 方式 对 应 着 两 种 第 二 名 
的 占据 方式 ， 无 论 前 两 名 由 谁 占据 ， 最 后 一 名 都 仅 有 一 种 占据 方式 。 
即 ， 三 个 位 置 的 占据 方式 共计 


第 二 名 的 占 播 方式 有 ?2 利 。 


方式 月 5 和 ”一 习 3 X 2 X 和 = 6 和 -一 :个 位 置 具有 6 和 占据 方式 ， 


六- 第 三 名 的 占据 
方式 响 1 种 . 


这 表示 ， 我 们 不 用 把 具体 排名 情况 列举 出 来 就 可 以 做 出 结论 : 这 3 虹 
马 有 6 种 排名 方式 。 


和 如果 有 H 区 马 呢 ? 


我 们 已 经 讲 过 ，3 匹 马 共有 3 x 2 x 1 种 排名 方式 ,将 这 个 算法 推 而 广 
之 ,可 以 知道 任意 数目 n 的 排名 方式 。 即 ， 如 要 算出 n 个 独立 对 象 的 
排名 方式 ， 可 按 下 式 进 行 计算 : 


nx(n=-1x(n=-2)x…x3x2X1 
如 此 一 来 ， 不 用 一 一 列举 每 种 可 能 的 现象 ， 也 能 算出 n 个 独立 对 象 
的 排名 方式 的 确切 数目 。 


这 种 计算 方式 称 为 一 个 数 的 阶乘 ， 其 数学 表达 式 是 感叹 号 ， 例 
如 ，3 的 阶乘 写作 3!，n 的 阶乘 写作 n!， 读 作 “n 的 阶 葬 ”。 


因此 ， 当 我 们 写 下 n!， 就 表示 “从 大 到 小 取 n 到 1 的 所 有 数 ， 并 将 这 
些 数 相 乘 ”， 即 执行 下 列 计算 ; 


nt=nxy(n=-1)x(n-2)x…x3x2X1 


许多 计算 器 都 将 n! 作 为 一 个 函数 ， 这 是 使 用 m! 的 好 处 。 例 如 ， 当 要 
计算 4 个 独立 对 象 的 排名 方式 的 数目 时 ， 只 需 计 算 4!， 即 4x3x2x 
1 = 24。 
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排序 、 排 位 、 排 


偶 形 排 位 


前 面 讲 到 的 计算 规则 有 一 个 例外 ， 那 就 是 图 形 排 位 。 


下 面 举 个 例子 。 假 定 你 想 让 4 匹 马 国 成 一 圈 ， 并 变 求 出 可 能 的 排 位 
方式 的 数目 。 现 在 让 我 们 看 看 这 种 情况 : 福 福 的 右边 是 拉 托 ， 左 边 
是 梁 香 ， 符 合 这 个 要 求 的 排 位 方式 共有 4 种 ,下面 是 其 中 两 种 。 


接力 
区 他 人 ) 
是 接 托 ,左边 是 彰 香 ” sy 
第 和 个 


猛 一 看 ， 这 两 种 排 位 不 一 样 ， 但 其 实 呢 ， 却 是 一 样 的 。 马 与 马 的 相对 位 
置 完全 一 样 ， 唯一 的 区 别 是， 第 二 幅 图 中 的 马 儿 们 绕 着 圆圈 动 了 一 动 。 
这 就 是 说 ， 马 匹 的 某 些 排 位 方式 实际 上 是 完全 一 样 的 。 


这 一 类 问题 该 怎么 解决 呢 ? 


3 98f 9 


大 罚 闭 阔 托 


关键 是 把 其 中 一 匹 马 的 位 置 固定 下 来 ， 比 如 福 福 。 只 要 福 福 站 在 某 个 
位 置 上 不 动 ， 就 能 计算 其 余 3 匹 马 的 排 位 方式 ， 这 样 就 能 避免 重复 计 
算 , 得 出 正确 的 结果 。 


通常 ， 如 果 有 n 个 对 象 需要 进行 圆 形 排 位 、 则 可 能 的 排 位 数目 按 下 式 
进行 计算 ; 个 对 铺 旦 国 稍 宰 位 
(n 一 1 一 你 的 旨 和 ， 
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世上 没有 傻 问 题 


阅 : nl 怎么 读 ? 


答 : 读 作 “n 的 阶 末 ”。 感叹 号 代 
表 一 种 数学 运算 ， 和 感情 没有 什么 关系 


| 问 : 阶乘 只 在 排 位 物体 的 时 候 有 
用 吗 ? 


签 : 绝对 不 是 这 样 ， 阶乘 在 其 他 
数学 分 支 中 也 能 派 上 用 场 ， 例 如 微 
积分 ， 总 的 说 来 ， 这 是 十 分 有 用 的 
数学 简便 算法 ， 只 要 进行 这 类 乘法 
运算 ， 就 能 看 到 阶乘 符号 

阶乘 符号 的 意思 是 “从 大 到 小 取 n 到 
1 的 所 有 数 ， 并 将 这 些 数 相 乘 ” 


阅 : ”如 果 n 的 数值 是 0 呢 ? 0 的 阶 
乘 怎么 求 ? 


答 : 01 为 1， 这 个 结果 似乎 有 些 
奇怪 ， 不 过 可 以 理解 为 “0 个 对 象 只 
有 1 种 排列 方法 ” 


| 问 : ”要 是 想 求 负数 的 阶乘 该 怎么 
办 ? 或 者 非 整数 的 阶乘 该 怎么 求 ? 


答 :阶乘 仅 针对 正 整数 ， 因 此 无 
法 求 负数 或 非 整数 的 阶 磁 。 


可 以 这 样 理解 ， 对 零碎 对 象 进行 排 位 
并 无 意义 ， 你 为 之 排 位 的 每 一 个 对 
象 都 被 认定 为 一 个 完整 的 对 象 ， 同 
时 ， 对 象 个 数 不 可 能 是 负数 。 
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世上 没有 傻 问题 
| 问 : ”阶乘 的 计算 结果 会 是 奇数 吗 ? 


答 : 
为 1 时 ， 
除 此 以 外 ， 所 有 其 他 数 的 阶乘 均 为 偶 
数 ， 这 是 因为 ， 只 要 n 大 于 等 于 2， 计 
算式 中 就 必定 会 包含 2 这 个 数字 ，2 
与 任何 整数 相 乘 结 果 均 为 偶数 。 所 以 
说 ， 只 要 n 大 于 等 于 2，nl 均 为 偶数 。 


只 有 两 种 情况 : 在 n 为 0 或 n 


n! 一 1 


侣 : ”计算 大 数 的 阶乘 似乎 是 一 种 折 
磨 ， 如 果 要 求 10!， 就 必须 将 10 个 数字 相 
乘 (10x9x8x7x6x5x4x3x2x1) ， 
结果 会 是 一 个 很 大 的 数 。 有 没有 简单 点 
的 办 法 ? 


答 : 有 啊 ， 许 多 科学 计算 器 和 绘图 
计算 器 都 有 阶乘 按键 ( 一 般 标 有 nl ) ， 
你 可 以 用 这 个 按键 进行 计算 。 











计算 : 





如 果 要 囊 w 个 对 象 的 可 能 排 位 方式 的 数目 ， 则 


Wl=wx (Ww-1)x... 
也 就 是 说 ， 将 从 mw 到 工 的 数字 金 部 相 乘 。 


峰 果 w 个 对 象 作 圆 彩排 位 ， 则 可 能 鬼 排 位 方式 
的 数目 为 (A- 1)!， 


阅 :计算 n 个 对 象 的 圆 形 排 位 时 ， 
结果 为 ( n -1) !。 如 果 把 顺 时 针 和 逆 
时 针 排 位 视 为 同一 种 情况 进行 计算 ， 
结果 如 何 ? 


答 : ”如 果 这 样 的 话 ， 排 位 方式 的 
数目 则 是 (n-1)!/2。 (n-1)! 既 考 
虑 了 顺 时 针 的 情况 ， 也 考虑 了 逆 时 
针 的 情况 ， 因 此 是 实际 要 计算 的 结 
果 的 两 倍 ， 除 以 2 就 解决 问题 了 。 


| 问 :如 果 将 对 象 呈 圆 形 排 位 ， 旦 
考虑 对 象 的 绝对 位 置 ， 结 果 如 何 ? 


答 : 


这 样 的 话 ， 排 位 方式 的 数目 


为 n!， 这 正好 等 于 n 个 对 象 的 排 位 方 
式 的 数目 。 


广 学 区 过 -家 这 


排序 、 排 位 、 排 


宝 娜 想 给 统计 邦 健身 俱乐部 打 电 活 ， 但 她 的 记性 实在 太 差 ， 她 只 知道 电话 号 码 由 1、2、3、 
4、5、6、7 组 成 ， 却 忘记 了 顺序 。 她 随机 拨 对 号 码 的 概率 是 多 大 ? 


有 人 提醒 宝 娜 ， 电 话 号 码 的 前 3 位 是 1、2、3 的 某 种 排 位 ， 后 4 位 是 4、5、6、7 的 某 种 
排 位 。 但 她 忘记 了 顺序 ， 这 射 她 拨 对 电话 号 码 的 概率 有 多 大 ? 


和 一 提示 : 这 一 决 常 要 对 
两 组 数据 估 排 位 ， 


统计 邦 德比 马场 要 在 本 季 示 组织 一 次 队列 表演 ， 马 匹 将 沿 着 赛 道 排 
成 贺 形 队列 。 马 匹 的 确切 顺序 将 随机 抽 了 到， 你 要 是 能 猜 中 这 个 顺序 ， 
将 会 获得 一 笔 奖 金 。 

你 猜 中 马匹 列队 顺序 并 获得 奖金 的 概率 是 多 大 ? 
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宝 娜 想 给 统计 邦 健身 俱乐部 打 电 话 ， 但 她 的 记性 实在 太 差 ， 她 只 知道 电话 号 码 由 1、2、3、 
4、5、6、7 组 成 ， 却 忘记 了 顺序 。 她 随机 拨 对 号 码 的 概率 是 多 大 ? 


有 7 个 数 灾 ， 因 此 有 7! 种 可 能 的 排 德 方 训 。7! = 一 7 x6 x5 xf xax2 xl 一 5040。 
因此 披 对 号 码 鬼 概率 为 1/5040 = 0.0002 


有 人 提醒 宝 娜 ， 电 话 号 码 的 前 3 位 是 1、2、3 的 某 个 排 位 ， 后 4 位 是 4、5、6、7 的 某 个 排 
位 。 但 她 忘记 了 顺序， 这 时 她 拨 对 电话 号 码 的 概率 有 多 大 ? 


光 焰 数 密 拆 分 为 两 组 ， 第 一 组 3 个 数字 (1, 2, 3)， 其 余 为 第 二 组 (4, 5, 6, 7)， 得 到 ， 


1、2Z、3 抬 楼 们 方式 拘 数 目 为 31(= 一 3 x2 x1=56 
4、5、6、7 有 网 排 位 方 式 鹏 数目 为 41=4 x3 x2 xf = 24 


为 了 囊 出 可 能 曲 排 使 方式 的 总 数 ， 可 将 网 组 排 位 千 果 抱 数 目 可 素 ， 得 到 ， 
可 能 网 排 位 方式 月 总 数 31x4! 一 6 x 24 一 144 


因此 ， 技 对 着 码 的 概率 为 1J[144 一 0.0069 









统计 邦 德比 马场 要 在 本 季 末 组 织 一 次 队列 表演 ， 马 匹 将 沿 着 赛 道 排 
成 圆 形 队 列 。 马 匹 的 确切 顺序 将 随机 抽取 ， 你 要 是 能 猜 中 这 个 顺序 ， 
将 会 获得 一 笔 奖金 。 


你 猜 中 马匹 列队 顺序 并 获得 奖金 的 概率 是 多 大 ? 


支 支 范 
~ 解答 















10 区 马 作 国 形 队列 ， 即 马匹 有 9! 种 可 能 拘 顺 洛 。 
91 = 3623880， 即 队列 有 362880 种 可 能 的 顺 兰 。 
生 对 结果 有 的 概率 为 1/9!， 几 和 孚 等 于 0。 
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花样 赛 开 始 了 


统计 邦 德比 马场 的 与 众 不 同 之 处 在 于 : 参加 比赛 的 并 不 
仅 有 普通 马 。 在 接 下 来 的 比赛 中 ，3 匹 斑马 将 与 3 匹 普 通 
马 同 场 竞技 。 


在 这 一 轮 比赛 中 ， 占 主导 作用 的 是 动物 种 类 ， 而 不 是 动物 
本 身 。 也 就 是 说 ， 我 们 感 兴趣 的 是 哪 一 种 动物 得 到 了 比赛 
的 哪 一 种 名 次 。 现 在 请 问 : 按照 动物 种 类 进行 排名 的 话 ， 
共有 几 种 排列 方式 ? 


德比 马场 设立 了 特别 赌局 ， 只 要 你 押 中 普通 马 和 斑马 的 最 
终 排名 位 置 ， 就 给 你 15 : 1 的 赔 率 。 问 题 是 ， 你 应 该 赌 一 
把 吗 ? 


人 动 动 能 





你 会 怎么 解答 这 类 问题 呢 ? 在 以 下 空白 处 写 下 你 的 想法 。 


排序 、 排 位 、 排 











在 上 一 轮 比 赛 中 ， 正 确 预 调 
到 第 一 名 的 概率 是 1/6， 规 在 
让 我 们 搏 一 把 范 样 赛 吧 ， 这 可 是 
统计 痢 歇 传统 尼 赛 ， 












第 6 章 排列 与 组 合 251 


按 种 类 排列 


按 个 体 排 名 与 按 种 类 排名 不 是 一 同事 
如 上 所 述 ， 如 果 今 天 的 花样 赛 中 有 3 匹 普通 马 和 3 匹 斑马 
参赛 ， 如 何 计算 普通 马 和 斑马 有 几 种 排名 方式 ? 






这 很 简单 ， 有 56 匹 马路 ， 所 以 有 56! 
种 排名 方式 。 









这 一 次 我 们 仅 对 动物 种 类 感 兴趣 ， 对 动物 个 体 不 感 兴趣 。 
前 面 我 们 仅 讲 过 对 独立 对 象 (例如 马匹 ) 进 行 排名 的 方式 及 其 数目 ， 假 
如 按照 这 种 情况 进行 计算 ， 我 们 可 算出 正确 的 结果 是 6! 。 


可 这 一 轮 比 赛 并 不 是 这 么 回 事 。 我 们 不 再 关心 哪 一 匹 马 或 哪 一 匹 斑 
马 会 排 在 哪个 位 置 ， 而 只 关心 哪 一 种 类 的 马 排 在 哪个 位 置 。 


例如 ， 对 于 3 匹 斑马 在 前 、3 匹 普通 马 在 后 这 种 排 位 情况 ， 我们 并 不 
想 清点 3 匹 普通 马 和 3 匹 斑马 的 所 有 排名 方式 。 到 底 是 哪 一 匹 斑马 跑 
了 第 一 无 关 紧 要 ， 知 道 跑 第 一 的 是 斑马 就 足够 了 。 


对 于 这 种 问题 ， 我 们 关注 
没 是 哪个 动物 种 类 排 在 哪 
个 位 置 ， 而 不 关心 哪个 动 
物 个 体 排 在 哪个 位 置 . 





我 要 把 那 学 竹马 身 
上 欣 带 子 扯 下 来 . 
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我 们 需要 授 种 类 排列 动物 


6 匹 马 会 有 6! 种 排名 方式 ， 但 这 个 答案 是 假定 我 们 想 知道 的 是 单 匹 普通 马 (或 斑马 ) 
的 所 有 可 能 排名 情况 . 

让 我 们 先 看 斑马 的 情况 ，3 匹 斑马 有 3! 种 排名 方式 ， 而 上 述 结 果 6! 中 包含 这 3! 种 排 
名 情况 , 但是， 由 于 我 们 不 关心 哪 一 匹 斑马 排 在 哪个 位 置 ， 因 此 这 些 排名 都 是 一 
样 的 。 于 是 ， 为 了 避免 重复 计算 ， 只 需 用 总 数 除 以 3! 就 行 了 





为 一 李 情 
3 数 除 心 下 ， 
接 下 来 看 普通 马 的 情况 。3 匹 普通 马 有 3! 种 排名 方式 ， 而 我 们 先前 算出 的 最 终 排名 结果 中 
包含 这 3! 种 排名 情况 ， 像 斑马 的 计算 方法 一 样 ， 为 了 避免 重复 计算 ， 我 们 只 需 用 最 终结 果 
除 以 3! 就 行 了 。 一半 我 们 将 3 区 验 马 作为 一 
二 况 ， 着 通 马 的 机 名 方式 二 人 


种 ， 因 此 或 们 用 排名 天 





这 意味 着 按照 种 类 对 6 匹 动物 进行 排名 的 数目 是 : 
总 共有 6! 种 动 











物 氮 名 .……， 一 一 6 720 
/人 33! 6x6 
i 但 3 区 着 通 马 为 一 关 ， 720 押 中 的 几率 是 1/20 ， 赔 率 


3 区 岗 马 也 为 一 类 ， 因 此 “36 则 为 15:1， 我 可 系 想 碰 这 


用 总 数 除 以 这 旦 类 动物 的 。 _ 个 赌局 ， 
排名 数目 . 0 
也 就 是 说 ， 正 确 押 中 不 同 种 类 动物 的 排名 的 概率 是 1/20。 9 


请 翻 到 下 一 页 ， 我 们 将 更 为 详细 地 讲述 这 种 情况 。 
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按 类 型 排列 的 通用 公式 


推导 出 用 于 重复 排列 前 公式 


设想 你 需要 清点 n 个 对 象 的 排 位 方式 的 总 数目 ， 再 设想 有 k 个 对 象 是 类 似 


对 象 。 


为 了 求 出 排 位 数目 ， 先 假定 n 个 对 象 是 独立 对 象 并 计算 它们 的 排 位 数目 ， 


用 结果 除 以 k 种 对 象 ( 类 似 对 象 ) 的 排 位 方式 ， 得 到 : 


总 共 嘲 wm 个 对 象 ， — nl 


有 有 ke 种 类 似 对 全 。 


我 们 还 能 进一步 推广 这 个 公式 。 


> KI 


A 个 对 铺 ， 其 中 R 种 对 象 为 
岗 楼 倍 方 疼 确 数目 为/ 


设想 要 对 n 个 对 象 进行 排 位 ， 其 中 有 一 类 对 象 共计 k 个 ， 另 外 还 有 一 类 对 象 共 


计 j 个 ， 你 可 以 通过 下 式 求 出 可 能 的 排 位 方式 的 数目 : 


总 共有 wm 个 
2 下 对 象 ， ny 


书 一 类 对 象 有 个 ,还 访 革 kk! 


通常 ， 在 计算 包括 重复 对 象 在 内 的 排 位 方式 数目 
时 ， 可 用 总 排 位 方式 数目 {n0 除 以 每 一 类 类 似 对 
象 的 排 位 方式 数目 (j, k! 等 等 )。 


254 深入浅出 统计 学 


ww 个 对 捕 鬼 神 位 方式 沟 数 目 ， 其 中 一 娄 有 | 
全 糯 似 双 象 ， 另 一 类 有 k 个 类 似 对 象 - 


重要 统计 量 
搜 类 型 排 位 


区 归 要 芍 凡 个 对 彰 排 位 ， 其 中 包括 第 
一 类 对 象 R 个 ， 第 二 类 对 象 | 个 ， 第 
三 类 对 和 象 以 个 …… 则 排 位 方式 数目 
的 计算 式 为 ， 













Wl 





JiRImL... 
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统计 邦 德比 马场 决定 用 自己 的 比赛 进行 实验 ， 他 们 打算 办 一 场 有 3 匹 普通 马 、2 匹 斑马 和 5 





人 习 匹 骆驼 参加 的 比赛 ， 所 有 的 动物 得 冠军 的 可 能 性 都 一 样 。 


1. 如 果 我 们 对 单个 动物 的 情况 感 兴趣 ， 那 么 有 多 少 种 排名 方式 ? 


2. 如 果 我 们 只 对 动物 种 类 的 排名 感 兴趣 ， 那 么 有 几 种 排名 方式 ? 


3.， 如 果 每 匹 动物 赢得 冠军 的 几率 一 样 大 ， 那 么 5 匹 骆驼 连 成 一 片 跑 完全 程 的 概率 有 多 大 ? 【 假定 我 们 关心 的 
不 是 单个 动物 所 占据 的 位 置 ， 而 是 每 一 类 动物 所 占据 的 位 置 。 ) 
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练习 解答 





A 统计 邦 德比 马场 决定 用 自己 的 比赛 进行 实验 ， 他 们 打算 办 一 场 有 3 匹 普 通 马 、2 匹 斑马 和 5 
殉 三 匹 骆 驼 参 加 的 比赛 ， 所 有 的 动物 得 冠军 的 可 能 性 都 一 样 。 
解答 


1. 如 果 我 们 对 单个 动物 的 情况 感 兴趣 ， 那 么 有 多 少 种 排名 方式 ? 
有 有 10 匹 动物 ， 因 此 有 101 = 3628.800 种 宰 名 方式 ， 


2. 如 果 我 们 只 对 动物 种 类 的 排名 感 兴趣 ， 那 么 有 几 种 排名 方式 ? 
有 普通 马 3 匹 ， 更 马 2 匹 ， 骆 芝 5 苞 ， 
10! EC 一 有 10 区 动物 ， 


312451 人 一 我 们 将 3 匹 马 作 为 一 类 ，2 区 岗 马 体 
_ 3,628,800 为 一 类 ，5 匹 骆驼 也 作为 一 类 . 


排列 数目 = 








6x2x120 


3,628,800 





1,440 


= 252 


3， 如 果 每 匹 动物 赢得 冠军 的 几率 一 样 大 ， 那 么 5 匹 骆驼 连 成 一 片 跑 完全 程 的 概率 有 多 大 ? 〔 假定 我 们 关心 的 


不 是 单个 动物 所 占据 的 位 置 ， 而 是 每 一 类 动物 所 占据 的 位 置 。 ) 


首先 ， 让 我 们 求 出 5 匹 驹 和 腕 集中 在 一 起 跑 完 全 程 的 方式 拘 数 目 ， 为 此 我 们 将 5 匹 驻 驱 划 归 为 一 个 划一 
对 和 象 ， 确 保 它 们 统一 行动 。 也 就 是 说 ， 光 果 我 们 将 一 群 骆 弦 挫 入 3 匹 狂 通 马 和 2 匹 妈 马 中 ， 实 际 上 
就 需要 对 6 个 对 象 进行 排列 ， 


61 人 & 一 1 群 骆驼 +3 区 马 +2 区 更 马 。 





排列 数目 = -一 
312! 个 我 们 把 3 匹 普通 马 当 作 一 实 类 似 对 象 ， 把 2 匹 允 
_720 马 也 雪 作 一 类 类 似 对 象 . 至 于 5 区 骆驼 ， 则 未 
6x2 必 除 以 51， 国 药 我 们 把 它们 计 范 1 个 对 象 了 ， 


720 


12 


一 60 


然后 ， 鸭 了 避 出 咏 上 情况 拘 发 生 概 率 ， 我 们 只 需要 用 骆驼 这 个 整体 她 完全 程 的 方式 揭 数 自 除 以 所 
有 动物 种 类 弛 完全 程 的 全 都 可 能 方式 的 数目 ， 这 在 上 面 已 经 计算 过 了 。 


因 尼 .5 匹 骏 驼 整体 鸣 宛 全程 的 概率 为 60/252 = 5721 。 
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阅 :在 前 面 的 练习 中 ， 为 什么 把 5 
匹 骆驼 当 作 一 个 对 象 ? 它们 绝对 是 各 
自 独立 的 骆驼 。 


签 :; 它们 的 确 是 各 自 独立 的 骆 
和 驼 ， 但 在 前 面 的 问题 中 ， 我 们 需要 
让 所 有 的 骆驼 成 为 一 个 总 体 ， 并 把 
这 些 绑 定 在 一 起 的 骆驼 当 作 一 个 对 
象 进行 处 理 。 


世上 没有 傻 问 题 


阅 : 似乎 多 个 不 同 对 象 的 排 位 方 
式 的 数 自 与 这 些 对 象 的 分 类 方式 有 关 。 


签 : 正确 。 池 所 计算 排 位 方式 的 
方法 是 一 门 技术 ， 但 还 有 很 大 一 部 
分 取决 于 你 的 思维 方式 。 


关键 在 于 周密 地 思考 实际 要 解决 的 
问题 ， 还 要 大 重 实 践 。 


二 十 区 马 航 比赛 正在 捍 行 


花样 赛 已 经 落幕 ， 斑 马 夺魁 。 下 一 轮 比赛 在 20 匹 马 之 间 进 行 。 









好 动 动 脑 


该 怎么 求 出 20 匹 马 中 的 前 3 甲 的 选取 方式 呢 ? 


你 想 你 能 预测 出 将 三 甲 
吗 ? 能 的 话 ， 赔 率 高 得 
惊人 ， 是 1500:1. 
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奖 :普通 马 、 班 马 和 骆驼 混在 一 
起 比赛 的 时 候 多 吗 ? 


: 这 是 不 可 能 的 ， 不 过 嘛 ， 这 
里 可 是 统计 邦 、 统 计 孝 德比 马场 可 
以 自得 其 乐 嘛 。 
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认识 排列 


前 三 早 归 属 方式 有 人 儿 种 ? 


主 赛 即将 开始 ， 共 有 20 匹 马 驰 驮 赛场 ,我们 需 要求 出 前 三 名 的 可 能 排名 方式 的 
数目 ， 然 后 才能 算出 猜 中 正确 排名 的 概率 。 


和 前 面 一 样 ， 我 们 可 以 先 求 出 马匹 占据 前 3 名 的 方式 有 几 种 ， 然 后 作出 解答 。 类 有 20 区 局， 即 占据 第 一 名 的 方 


让 我 们 从 第 一 名 开始 计算 ， 共 有 20 匹 马 ， 即 占据 第 一 名 的 方式 有 20 种 ， 当 这 个 有 
位 置 被 占据 后 ， 剩 下 19 匹 马 占 据 第 二 名 ， 再 接着 就 是 18 匹 马 占 据 第 三 名 。 19 种 ， 占据 第 三 
















在 这 场 比赛 中 ,我 们 对 剩 下 的 位 置 被 哪 匹 马 占 据 并 不 感 兴趣 ， 只 有 前 3 名 才 


对 我 们 有 意义 。 也 就 是 说 ， 前 3 名 的 排列 总 数 是 : 
20 x 19 x 18 = 6,840 a 


于 是 ， 准 确 猜 中 前 三 甲 正确 排名 的 概率 为 1/6,840。 


这 正 是 正确 答案 ， 不过， 如 果 马 苞 数 目 增多 ， 或 者 要 排 
的 名 决 增多， 那么 计算 就 会 挛 得 氢 杂 起 来 。 






我 们 需要 用 一 个 更 简 炼 的 方法 解决 这 类 问题 。 
在 这 里 我 们 只 需要 将 三 个 数 相 乘 ， 要 是 需要 将 更 多 的 数 相 乘 该 怎么 办 ? 


我 们 需要 总 结 出 一 个 公式 ， 以 便 求 出 从 一 个 较 大 的 马匹 群体 中 抽出 
一 定数 目的 马匹 进行 排名 的 排名 方式 总 数 。 
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何 为 排列 


讲 到 这 里 ， 我 们 如 何 用 阶乘 重新 表示 以 上 算式 ? 
排名 方式 的 数目 为 20 x 19 x 18， 让 我 们 重新 推导 一 下， 看 看 有 何 结果 。 


20 x 19 x 18= 
{lJ7 x 16x .x3x2x 1) 
20! 


17! 


这 是 和 前 面 一 样 的 算式 ， 不 过 现在 用 阶乘 表示 。 


这 就 是 同一 算式 的 阶 系 志 示 法 。 


从 20 个 对 象 中 取出 3 个 对 象 并 进行 排 位 ， 所 得 的 排 位 方式 的 数目 有 一 个 


正式 名 称 ， 叫 做 “排列 数目 ”， 如 前 所 述 ， 排 列 数目 的 计算 方法 如 下 : 
20! 

(20 - 3)! 

2,432,902,008,176,640,000 
355,687,428,096,000 

E 6,840 





我 们 前 面 得 到 的 
也 是 这 个 答案 ， 


一 般 说 来 ， 从 n 个 对 象 中 取出 r 个 对 象 的 排列 数目 即 n 个 对 象 中 的 每 一 
组 对 象 (r 个 ) 的 可 能 排 位 方式 数目 ， 通 常 写作 P,， 即 : 


这 是 对 象 总 数 ，~、、 
n! 
P， 
这 是 要 计 其 的 7 (n - r)! 
对 重 钦 数目. 


所 以 ， 若 想 知 道 从 n 个 对 象 中 取出 r 个 对 象 进行 排 位 的 排 位 方式 数目 ， 
排列 算式 是 个 关键 。 





20 x 19 x 18 x {17x 16x..x3x2x 1) 
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于 上 17117! 语 ， 式 邹 
Ac 结果 还 是 一 样 。 


排列 是 指 从 一 个 较 
大 (n 个 ) 对 象 群体 中 
取出 一 定数 目 (r 
个 》 对 象 进 行 排序 ， 
并 得 出 排序 方式 总 
数目 。 


我 从 设 址 省 过 关于 马匹 排名 鬼 


位 何事 。 和 鳍 锋 看 ， 哪 几 匹 马 禽 
或 元 前 三 甲 ， 你 和 示 会 负 干 的 
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认识 组 合 





假如 马匹 排名 无 关 紧 要 

前 面 已经 讲 过 从 20 匹 马 中 取 3 开关 进行 排名 的 结果 ， 也 就 是 说 ， 我 们 知道 可 以 给 出 多 少 种 yj 未 尖 要 让 克 因 和 
准确 排名 。 前 3 匹 马 号 完 比赛 的 网 
而 这 一 次 ， 我 们 不 再 想 知道 排列 数目 ， 而 想 知道 前 三 匹 马 的 组 合 数目 一 我 们 仍然 需要 pe 
知道 前 三 名 有 多 少 种 组 合 方式 ,但 前 三 名 的 确切 排名 并 不 细 究 。 就 足够 了 下 


J 





我 们 该 如 何 解 决 这 类 问题 呢 ? 
目前 ， 排 列 数目 包括 对 前 3 匹 马 进 行 确 切 排名 的 情况 ， 而 3 匹 马 的 排名 方式 有 3! 种 ， 
因此 我 们 用 排列 数目 除 以 3!， 所 得 结果 即 为 选 出 占据 前 三 名 的 马匹 但 忽略 它们 的 
确切 排名 的 选择 方式 的 数目 。 
结果 为 : 

20! ”6,840 

3!117! 3! 

= 1,140 


也 就 是 说 ， 选 出 前 3 名 马匹 并 进行 排名 的 排列 方式 有 6,840 种 ， 但 如 果 不 介意 排名 ， 
则 为 组 合 ， 而 组 合 方式 有 1,140 种 。 







赢 的 机 会 是 1X1.140， 和 形势 对 你 十 
分 不 利 。 不 过 ， 赔 率 也 很 惊人 人， 是 
1.500:1。 所 以 还 是 有 的 头 的 ， 就 看 
你 愿意 捏 多 大 风险 了 . 
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何 为 组 合 

我 们 前 面 曾经 求 出 一 种 计算 排列 的 通用 方法 ,组合 其 实 也 有 这 样 一 种 
方法 ， 

一 般 说 来 ， 组 合 数 目 即 为 从 n 个 对 象 中 选取 r 个 对 象 的 选取 方式 的 数目 ， 
这 时 不 必 知 道 所 选 对 象 的 确切 顺序 。 组 合 数 目 写作 “C, 即 : 


这 是 对 象 的 总 
n i 2 C7 
Cr = (n-r)! 
这 是 要 计算 的 /7 
对 象 的 数 日 。 


求 组 合 的 时 候 除 以 一 个 六 就 行 > 
那么 排列 与 组 合 有 何 区 别 ? 


排列 组 合 


排 





排列 是 指 从 一 个 群体 中 选取 几 个 对 象 ， 在 考虑 这 几 组 合 是 指 从 一 个 群体 中 选取 几 个 对 象 ， 在 不 考虑 这 几 
个 对 象 的 顺序 的 情况 下 ， 求 出 这 几 个 对 象 的 选取 方 个 对 象 的 顺序 的 情况 下 ， 求 出 这 几 个 对 象 的 选取 方式 





式 的 数目 。 在 需要 知道 每 个 位 置 的 确切 占 位 情况 时 ， | 。 的 数目 。 在 不 需要 知道 每 个 位 置 的 确切 占 位 情况 时 ， 
这 是 一 种 比 组 合 更 明确 的 方法 . 组 合 是 比 排列 更 通用 的 算法 ， 只 要 知道 所 选择 的 是 哪 
几 个 对 象 就 足够 了 。 
排列 : 与 烦 夯 有 关 组 合 : 与 烦 厅 无 关 
这 些 是 各 系 
相同 的 术 列 ， 








NN 
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组 合 访谈 


262 


组 合 沪 谈 


本 周 话题 : 


顺序 重要 吗 ? 


Head First: 欢迎 来 到 我 们 的 节目 ， 组 合 先生 。 
组 合 : 谢谢 您 的 邀请 ，Head First。 


Head First: 让 我 们 开门 见 山 吧 。 很 多 人 都 注意 到 ， 
你 和 排列 十 分 相似 ， 你 对 此 有 同感 吗 ? 


组 合 : 我 知道 人 们 为 什么 会 这 样 想 ， 因 为 我 们 处 理 
的 情况 十 分 相似 ， 我 们 都 关系 到 从 一 个 群体 中 选取 
一 定数 目的 对 象 。 话 是 这 么 说 ， 不 过 我 们 的 相似 程 
度 也 就 仅 此 而 已 吧 。 

Head First: 那么 你 们 有 什么 不 同 之 处 呢 ? 


组 合 : 哦 ， 在 初学 者 看 来 ， 我们 的 态度 截然 不 同 。 
排列 对 顺序 很 介意 ， 他 在 选择 对 象 时 非常 关心 选取 
顺序 。 他 不 仅 要 挑选 对 象 ， 还 要 给 对 象 排 个 位 。 我 
是 说 ， 他 真是 的 ! 


Head First: 这 么 说 你 不 这 么 做 ? 


组 合 : 我 绝 不 ! 我 相信 排列 的 所 作 所 为 可 谓 著 躬 尽 
疗 ， 但 坦白 说 ， 生 命 苦 短 ， 我 所 关心 的 是 ， 是 否 已 
经 从 某 个 群体 中 选 出 了 对 象 ， 若 已 经 选 好 ， 那 就 达 
到 目的 了 。 

Head First: 所 以 你 好 过 排列 ? 


组 合 : 我 不 愿意 说 我 们 两 个 谁 比 谁 好 ， 好 或 不 好 要 
看 具体 情况 。 就 拿 演奏 家 打 个 比方 吧 …… 
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Head First: 演奏 家 ? 


组 合 : 是 的 ， 很 多 演奏 家 都 有 曲目 表 ， 你 可 以 从 中 
选择 要 演奏 家 演奏 的 曲目 。 


Head First: 我 想 我 明白 你 要 说 什么 了 …… 


组 合 : 这 么 说 ,排列 和 我 都 对 曲目 表 上 的 曲目 感 兴 
趣 , 但 感 兴趣 的 方式 不 同 。 我 只 要 知道 曲目 表 中 有 
哪些 曲目 就 很 开心 了 ， 而 排列 却 想 得 更 多 。 他 不 仅 
想 知道 曲目 表 中 的 曲目 ， 还 想 知 道 曲 目的 演奏 顺 
序 。 如 果 改 变 曲目 顺序 ， 组 合 不 变 ， 但 排列 就 变 
了 。 


Head First: 谈 一 谈 你 的 计算 方法 吧 ， 计 算 组 合 的 方 
法 和 计算 排列 的 方法 相似 吗 ? 


组 合 : 相似 ， 但 略 有 区 别 。 计 算 排列 的 时 候 ， 先 求 
n!， 接 着 除 以 (n - r)!。 我 的 算法 很 相似 ,但 要 再 多 
除 以 一 个 rt， 通常 这 会 让 我 变 得 更 小 ， 这 是 可 以 理 
解 的 ， 我 就 是 比 排列 来 得 痛快 。 


Head First: 通常 会 变 得 更 小 吗 ? 


组 合 : 我 换个 说 法 吧 ， 在 相似 基础 数据 下 ， 排 列 永 
远 不 会 比 我 小 。 


Head First: 组 合 先生 ， 谢 谢 您 接受 采访 。 
组 合 : 我 很 乐意 。 


阅 ; 我 听 说 过 “选取 ”这 样 的 字 
眼 ， 这 是 什么 意思 ? 


管 : 这 是 组 合 的 另 一 个 术语 。 
nC ,的 本 意 是 “你 有 n 个 对 象 ， 选 取 r 
个 ”， 因 此 有 时 候 也 称 为 选择 函数 。 


阅 ， 排列 会 小 于 组 合 吗 ? 


答 基础 数据 相同 的 情况 下 绝对 
不 会 。 计 算 组 合 要 用 排列 结果 再 除 
以 一 个 数值 ， 因 此 结果 青 定 变 小 。 
当 排 列 与 组 合 相 等 时 ， 也 就 是 选取 0 
个 或 1 个 对 稍 时 ， 纤 果 最 接近 你 所 说 
的 情况 。 





排列 





ml 





(Wr)! 


重 受 统计 量 


如 果 从 nm 个 对 象 中 选取 r 个 
对 乏 ， 则 李 列 数目 为 ， 


世上 没有 俐 问题 


阅 : 什么 是 排列 ? 什么 是 组 合 ? 
我 又 糊涂 了 。 


人: 排列 指 的 是 选取 对 象 并 关注 
这 些 对 象 的 排 位 顺 订 ,进而 得 出 结 
果 ; 组 合 指 的 是 选取 对 象 但 不 关注 这 
些 对 象 的 排 位 顺序 ， 印 可 得 出 结果 。 


说 | : 我 还 是 有 些 糊涂 ， 如 果 要 求 
从 n 个 对 象 中 选取 /个 对 象 的 组 合 ， 是 
该 写成 vC 还 是 *C ? 


答 :号 成 *C,， 记 民 穷 门 : 数字 
越 大 ， 位 置 越 高 。 


阅 :; 它 有 别 的 表示 方法 吗 ? 我 想 
我 在 什么 地 方 看 到 过 组 合 的 表示 方法 ， 
不 过 不 是 这 个 样子 。 

繁 ; 组 合 的 表示 方法 有 不 少 ， 我 


们 用 的 是 "C,， 但 另外 还 有 一 种 表示 
法 ， 好; 


组 合 


合 数目 为 ， 


如 果 从 wm 个 对 象 中 选取 r 个 对 象 ， 则 组 
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阅 ; 排列 和 组 合 是 否 的 确 十 分 
重要 ? 


答 : 没 错 ， 尤 其 是 组 合 ， 本 书后 
文 还 多 有 涉及 。 需 要 的 时 候 要 记得 
用 哦 。 


问 ; ”计算 排列 和 组 合 的 情况 似乎 
和 计算 类 似 对 象 的 情况 很 相似 ， 对 吗 ? 


签 : 过 程 相似 。 在 计算 类 似 对 象 
时， 是 用 排 位 方式 的 总 数目 除 以 类 
似 对 象 的 分 类 数目 。 


对 于 排列 可 以 这 样 理解 : 你 选取 互 
不 同类 的 所 有 对 象 讲 行 计算 ， 因 此 用 
n! 除 以 (n-r)!; 对 于 组 合 可 以 这 样 理 
解 ， 你 选取 的 对 象 都 是 同类 ， 所 以 
要 用 排列 的 数目 再 除 以 rl。 
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加 数据 邦 全 明星 篮球 队 即 将 参加 一 场 比赛 ， 在 册 队 员 12 名 ， 同 一 时 间 人 允许 5 名 队员 上 场 比赛 。 


然 三 


1. 同一 时 间 上 场 比赛 的 队员 有 几 种 出 场 方式 ? 





2, 教练 指定 了 3 名 队员 做 投篮 主力 。 如 果 这 3 名 主力 是 随机 选择 的 ， 那 么 3 名 主力 在 同一 时 间 上 场 的 概率 有 多 大 ? 


264 深入浅出 统计 学 


排 床 、 排 位 、 排 


现在 该 算 扑克 牌 概率 了 ， 看 看 你 怎么 应 付 。 
锯 习 -天 牌 有 52 张 ,一 手 牌 有 5 张 ， 拿 一 手 牌 的 方式 有 几 种 ? 





全 部 同 花 的 10、J、Q、K、A 组 成 一 个 同 花 大 顺 。 拿 到 这 种 扑克 牌 组 合 的 概率 是 和 多少? 用 上 一 题 的 答案 帮忙 解答 。 


四 张 数字 相同 的 牌 组 成 一 个 “炸弹 ”， 再 加 一 张 牌 就 成 一 手 。 合 到 这 种 扑克 上牌 组 合 的 概率 是 多 少 ? 


五 张 花色 相同 的 竹 组 成 一 手 同 花 牌 。 拿 同 花 牌 的 概率 是 多 少 ? 
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练习 解答 


数据 邦 全 了 明星 篮球 队 即 将 参加 一 场 比赛 ， 在 册 队 员 12 和 名 ， 在 同一 时 间 人 允许 5 名 队员 上 场 比 
刁 赛 。 
解答 
1. 同一 时 间 上 场 比赛 的 队员 有 几 种 出 场 方式 ? 
在 册 队 页 有 1712 名， 我 们 需要 计算 从 其 中 抛 逸 5 名 队员 拘 抽 园 方 式 的 数目 ， 不 需要 对 搜 阮 出 来 胸 队 员 
硅 行 排骨 ， 因 此 可 以 用 组 合 庆 行 计算 。 
ft 
~ 51(12-5)! 





I2 
村 


2. 教练 指定 了 3 名 队员 做 投篮 主力 。 如 果 这 3 名 主力 是 随机 选择 的 ， 那 么 3 名 主力 在 同一 时 间 上 场 的 概率 有 多 大 ? 


让 我 们 光 算 ?名 立 力 同时 上 场 曲 方 式 的 数目 。 


由 果 3 名 至 力 同时 上 场 ， 就 表示 还 剩 下 2 个 位 置 供 其 他 队员 填补 。 我 们 需要 束 出 从 剩余 9 名 队员 中 选 
取 2 名 队员 奸 御 上 述 2 个 位 置 拘 组 合 数目 。 
9! 


? — 
z 





21(9-2)! 
9! 


217)1 
= 36 


这 就 是 说 ，3 名 评 力 同时 上 场 抬 概率 为 : 


367792 = 1/22 
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排序 、 排 位 、 排 


现在 该 算 扑 克 牌 概率 了 ， 看 看 你 怎么 应 付 。 
习 一 副 牌 有 52 张 ， 一 手 牌 有 5 张 ， 拿 一 手 牌 的 方式 有 几 种 ? 
解答 一 副 牌 有 52 张 ， 我 们 需要 从 中 远 排 5 夭 。 


521 
#0 =——— = 2,598,960 
4715! 


全 部 同 花 的 10、J、Q、K、A 组 成 一 个 同 花 大 岩 。 拿 到 这 种 扑克 牌 组 合 的 概率 是 多 少 ? 用 上 一 题 的 答案 帮忙 解答 。 
每 一 种 玫 色 出 现 这 种 组 合 钩 情况 有 1 种 ,总共 4 种 共 色 .也 就 是 说 ， 拿 到 同 苍 大 晰 的 方式 有 4 种 ， 





P( 同 冰 大 顺 ) = 
2,598,960 


= 1/649,740 
一 0.0000015 


四 张 数 字 相 同 的 牌 组 成 一 个 “炸弹 ” ， 再 加 一 张 牌 就 成 一 手 。 合 到 这 种 扑克 牌 组 合 的 概率 是 多 少 ? 


让 垢 们 从 “ 炸 群 ”着 手 ， 总 共 考 13 种 可 能 ， 即 组 成 “ 炸 娠 ”的 方式 有 13 种 ， 双 要 记 出 一 到 “ 炸 儿 ”， 就 
剩 下 +3 张 牌 ， 也 就 是 说 ， 这 样 一 手 脾 的 组 成 方式 的 数目 为 : 13x48 = 624， 

624 
PF( 炸 伏 ) = 一 一 一 一 
2,598,960 
= 1/4165 


= 0.00024 


五 张 花色 相同 的 牌 组 成 一 手 同 花 牌 。 拿 同 花 牌 的 概率 是 多 少 ? 


区 了 事 出 可 能 蚂 组 合 网 数目 ， 先 求 一 套 同 花 牌 选取 方式 议 数 目 . 这 个 数目 为 f+， 然 后 进取 这 寒 花色 中 的 5 
发 脾 。 专 种 花色 有 13 张 脾 ， 于 是 所 囊 组 合 数 日 为 


4 x 131 





4x 0, == 
B815! 


=4x1287 = 5148 
S148 





P( 同 基 ) = 


2,598,960 
= 33/16660 
= 0.00198 
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拉 托 万 岁 ! 


比赛 结束 


二 十 匹 马 的 比赛 已 经 结束 ， 冠 军 拉 托 ， 梁 香 屈居 
第 二 ， 福 福 季军 。 如 果 你 当初 决定 押 这 三 匹 马 赢 ， 
那 你 就 发 了 ! 





| 


统计 郑 恐 比 马场 第 2 名 : 第 3 名 : 
林 年 刻 吞 军 : 音 竺 福 福 
拒 托 





在 本 章 中 ， 你 学 习 了 如 何 处 理 各 种 排名 、 排 位 和 排列 ， 
以 及 如 何在 不 一 一 列举 各 种 可 能 性 的 情况 下 快速 算出 可 
能 的 排列 、 组 合 的 数目 。 

这 些 知 识 将 大 大 提高 你 求 概率 和 作 统 计 的 能 力 。 请 接着 
读 下 去 ， 我 们 会 继续 指点 你 练 就 更 强 功力 。 
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关 
# 坚持 离 敢 } 





计算 概率 分 布 颇 为 费时 。 

前 面 讲 到 如 何 计算 和 利用 概率 分 布 ， 不 过 ， 如 果 方 法 更 简单 一 些 ， 计 算 速度 更 快 一 
些 ， 效 果 岂 不 更 好 ? 在 本 章 中 ， 我 们 将 介绍 一 些 特殊 的 概率 分 布 ， 这 些 概率 分 布 有 
着 十 分 固定 的 模式 。 只 要 懂得 这 些 模式 并 善 加 利用 ， 就 能 以 前 所 未 有 的 速度 计算 概 
率 、 期 望 、 方 差 。 接 着 读 吧 ， 让 我 们 一 起 来 认识 几何 分 布 、 二 项 分 布 及 泊 松 分 布 。 


进入 新 的 篇 章 
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小 心 树木 


倒 堆 的 滑雪 者 查 德 


查 德 喜欢 滑雪 ， 但 他 是 个 事故 大 王 ， 哪 怕 雪 坡 上 只 有 孤零零 的 一 
棵 树 ， 他 也 准 能 撞 上 去 。 查 德 希 望 自己 不 要 总 是 撞 在 树 上 ， 滚 在 
雪 里 ， 他 的 保险 费 如 今 可 是 一 笔 大 开销 。 






查 德 大 概 在 这 儿 ， 看 
看 一 路 上 这 些 贷 掉 鹏 
树 ， 就 知道 他 第 一 不 








哎呀 ! 石头 ! 哎呀 | 
旗杆 ! 哎呀 | 树 ! 









查 德 对 自己 在 雪 坡 上 的 表现 寄 望 其 高 ， 他 的 自尊 ， 他 对 雪上 美女 的 
成 功 追 逐 ， 他 的 保险 ， 为 此 他 愿意 冒 丢人 现 眼 、 断 手 断 脚 、 保 险 大 
打折 扣 的 风险 学 习 新 的 滑雪 技巧 ， 但 必须 保证 他 试 滑 不 到 10 次 就 能 
获得 成 功 。 


查 德 不 出 事故 顺利 滑 至 坡 底 的 概率 是 0.2， 他 打算 不 停 尝 试 ， 直 至 大 
功 告 成 。 在 取得 第 一 次 成 功 后 ， 他 将 停止 滑雪 ， 高 唱 凯 歌 回 小 旅馆 。 


270 深入浅出 统计 学 


几何 分 布 、 二 项 分 布 及 泊 松 分 布 


现在 来 练习 练习 你 求 概率 的 技术 。 查 德 在 任意 一 次 试 滑 中 (假定 每 
一 次 试 滑 都 是 独立 的 ) 不 出 事故 顺利 抵达 坡 底 的 概率 均 为 0.2。 如 
果 需 要 试 滑 两 次 ， 概 宰 如 何 ? 他 斌 滑 一 次 或 两 次 就 能 成 功 滑 至 坡 
“和 是 多大 记 住 ， 当 他 区 得 首次 成 功 后 ， 就 打 加 手 三。 
查 德 可 谓 百 折 示 接 ， 在 位 何 一 


次 请 雪 中 道 遇 的 陵 倒 掉 政 都 提示 ， 你 可 能 打算 画 一 棵 报 
示例 影响 他 下 一 次 的 表现 。 率 村 ， 以 便 让 问题 外 观 可 视 . 
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动 动笔 解答 
AR 解 带 现在 来 练习 练习 你 求 慨 率 的 技术 。 查 德 在 任意 一 次 试 滑 中 (假定 每 

一 次 试 滑 都 是 独立 的 ) 不 出 事故 烦 利 抵达 坡 底 的 概率 均 为 0.2。 如 

果 需 要 试 滑 两 次 ， 概 率 如何 ? 他 试 滑 一 次 或 两 次 就 能 成 功 滑 至 坡 

底 的 概率 是 多 大 ? 记 住 : 当 他 获得 首次 成 功 后 ， 就 打算 黑手 不 干 。 


下 面 是 一 捍 概 率 树 ， 其 中 给 出 了 前 两 决 斌 请 的 报 率 ， 有 了 这 些 就 角 算 出 皂 率 了 。 


0,2 训 功 局 
第 2 决 该 请 
0.2 战功 
0.8 
失效 
各 入 第 一 次 识 光 和 类 下 


如 时 用 义 表示 最 竺 滑 到 坡 祝 需要 访 渭 鬼 决 数 ， 刚 : 
PX = 人) =P( 第 1 决 访 江 成功) 
一 0.2 


P(X = 2) =P( 第 2 决 沪 清 成 功 站 第 1 决 访 渭 类 狐 ) 


= 0.2x0.8 
= 0.16 

ee A i 
= 0.2+0.16 立 . 因此 可 以 相 加 . 


= 0.36 


272 深入浅出 统计 学 


几何 分 布 、 二 项 分 布 及 泊 松 分 布 


我 们 需要 求 出 查 德 的 概率 分 布 

现在 ， 你 已 经 求 出 了 查 德 在 雪 坡 上 试 滑 不 出 3 次 就 能 成 功 的 概率 ， 不 
过 ， 如 果 你 需要 了 解 他 试 滑 不 出 10 次 (因为 保险 的 原因 ) 就 成 功 的 概率 ， 
那 该 怎么 办 ? 20 次 呢 ? 100 次 呢 ? 

相对 于 每 一 次 都 老 老实 实地 从 头 开 始 计算 概率 ， 概 率 分 布 可 能 更 方便 
为 此 ， 我 们 需要 指出 查 德 最 终 到 达 坡 底 需 试 滑 次 数 的 每 一 种 可 能 性 ， 
并 算出 相应 概率 。 










慢 着 。 如果 要 算出 每 一 种 可 能 
次 数 歇 概率 鬼话 ， 我 们 这 世子 什 
么 别 的 事 都 别 想 千 了 . 


这 样 做 有 问题 ， 因 为 可 能 次 数 无 穷 无 尽 。 

只 要 尚未 试 滑 成 功 ， 查 德 就 会 不 停 地 试 下 去 。 他 可 能 要 试 1 次 ，10 
次 ，100 次 …… 甚至 1,000 次 。 查 德 到 底 什 么 时 候 会 获得 首次 成 功 ? 谁 也 
不 能 确定 









那么 你 是 希望 我 为 一 些 无 穷 元 
尽 的 东西 计算 概率 分 布 ? 你 这 是 
在 开玩笑 吧 ? 


即使 可 能 次 数 无 穷 无 尽 ， 还 是 有 办 法 求 出 它 的 概率 分 布 的 。 
这 其 实 是 一 种 特殊 的 概率 分 布 ， 这 种 概率 分 布 具 有 一 些 特殊 属性 ， 能 够 
简化 概率 、 数 学 期 望 ， 以 及 方差 的 计算 。 


让 我 们 看 看 如 何 处 理 。 
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查 德 的 概率 峙 


这 种 概率 分 布 有 一 种 固定 模式 


让 我 们 用 变量 X 表 示 查 德 为 了 在 雪 坡 上 取得 一 次 成 功 而 需要 
经 历 的 试 滑 次 数 。 查 德 只 禹 要 成 功 一 次 即 可 ， 此 后 他 将 停止 
试 滑 。 


让 我 们 先 看 前 4 次 试 滑 ， 据 此 计算 X 的 前 4 个 数值 的 概率 。 然 后 ， 
我 们 可 以 看 看 是 否 存在 某 种 固定 模式 能 帮助 我 们 轻松 地 算出 其 
余数 值 的 概率 。 










第 1 次 试 滑 二 一 在 第 1 决 说 少时 获 
得 聊 功 网 概率 ， 
成 功 到 德 在 第 3 
0.2 P(X = 引 鲍 覃 
慨 齐 ， 部 前 2 决 说 请 类 
成 功 人 多 第 3 决 斌 请 攻 功 ， 
0.2 第 3 次 试 滑 ”从 ， 
0.8 
失败 成 功 
0.2 第 4 次 试 滑 
0.8 
闪 败 02 成 功 
0.8 
失败 
门 08 由 
这 出 横 间 是 通 这 

下 面 是 X 前 4 次 的 概率 。 某 负 放宽 测 轨 的 。 
x [PX=x) | 
Th2 | 
~ we ey 
人 
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几何 分 布 、 二 项 分 布 及 汽 松 分 布 


下 玫 用 于 填写 X 取 不 同 数值 时 的 相应 概率 ， 请 填写 表格 ， 写 出 试 滑 次 数 为 x 时 的 概率 ， 并 指 
出 每 种 情况 下 ，0.8 的 融和 0.2 的 可 {0.8 和 0.2 在 P(X = x) 中 出 现 的 次 数 ) 分 别 是 多 少 。 








Y 是 的 一 个 特定 值 ， 但 现在 证 计算 的 
Sa 2 是 留 给 你 做 。 
未 告诉 你 到 展 是 哪个 值 ， 你 能 这 一 大 示 空 名 

称 一 稀 r 的 相位 摄 率 是 多 消 蚂 ; 
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下 表 用 于 填写 X 取 不 同 数值 时 的 相应 概率 ， 请 填写 表格 ， 写 出 试 滑 次 数 为 x 时 的 概率 ， 并 指 
出 每 种 情况 下 ，0.8 的 票 和 0.2 的 标 (0.8 和 0.2 在 P(X = x) 中 出 现 的 次 数 ) 分 别 是 多 少 。 


省 X 一 4 有 时 ， 查 德 先 失效 3 次， 第 4 决 成 功 。 
由 于 革 决 试 渭 的 成 功 概 率 为 0.2， 失 败 概 率 为 0.8， 因 此 P(X 二 有 为 0.8 x 0.8 x 0.8x0.2. 


当 X 二 5 时 ， 查 德 先 失败 4 决 ， 第 5 决战 功 ， 即 


P= 5)=0.8x0.8x0.8x0.8x0.2, 


那么 , P 公 = 中 是 和 多少 噬 ?7 车 查 禧 在 第 r 次 斌 清 时 成 功 ， 出 肯定 已 经 先 类 败 过 (r - 1) 次 ， 于 是 
PX= 跻 =0.8x08x…x08x02 即 表达 式 中 的 0.8 取 人 r- 力 决 需 。 


















一 会 此 用 P{ 义 =x) ， 一 会 
此 叉 用 P(X=r)。 和 你 起 渍 束 
了 再 说 好 不 好 。 


这 说 的 是 两 码 事 。 
当 写 成 P(X=x) 的 时 候 ， 表 明 x 能 取 概 率 分 布 中 的 任何 值 。 我 们 在 上 表 中 
给 出 了 x 的 不 同 数值 ， 并 算出 了 出 现 每 种 数值 的 概率 。 


当 写 成 P(X=r) 的 时 息 ，x 等 于 特定 数值 r+， 我 们 要 求 的 就 是 这 个 特定 数 
值 的 发 生 概 率 。 只 不 过 ,我 们 还 没有 指定 这 个 特定 数值 z 到 底 是 多 少 ， 
这 是 为 了 能 得 出 通用 的 概率 算式 。 


差不多 等 于 这 么 说 : x 可 以 取 任 何 值 ， 包 括 固定 数值 r。 
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概率 分 布 可 以 半 代 数 式 天 示 


如 你 所 见 ， 查 德 的 滑雪 试验 有 其 特定 模式 。 每 一 个 概率 都 是 0.8 和 0.2 
的 乘积 ， 利 用 下 式 ， 你 能 迅速 算出 任意 次 数 r 的 往 率 : 


P(X =r)=0.8"! x 02 


即 ， 如 果 要 求 P(X = 


100) ， 你 不 需要 画 出 一 标 硕 大 无 比 的 概率 树 ， 也 


不 用 把 每 一 次 试 滑 的 情形 想 得 清 清楚 楚 ， 只 要 这 样 算 就 行 : 


P(X = 100) = 0.8” x 0.2 


我 们 可 以 进一步 总 结 这 个 公式 。 如 果 用 p 代 表单 次 试 滑 的 成 功 概率 ， 
出 失败 的 概率 为 1-p， 我 们 将 此 概率 称 为 gs， 于 是 可 以 用 下 式 计算 任何 


具有 这 一 性 质 的 概率 : 


人 fr 站 次 失 歼 ，1 次 茂 


P(X=r)=q"m1pK 坟 在 我 们 的 鲁 可 中， 


这 个 公式 叫做 概率 的 几何 分 布 。 
问 ; 总结 这 个 公式 有 什么 意义 


呢 ? 这 只 是 我 们 所 计算 的 一 个 特别 问 
题 而 已 。 


签 ;， 总 结 这 个 公式 是 为 了 用 到 
其 他 类 似 问 题 上 。 如 果 我 们 能 够 总 
结 出 这 类 问题 的 结果 ， 以 后 醚 到 类 
似 情况 时 就 能 加 快 计 算 速 度 。 


阅 :你 说 过 ， 我 们 需要 求 出 px=n 
的 表达 式 ，" 是 什么 ? 


签 ; p(Xc=n 才 示 “X 等 于 数值 r 
的 概率 ”， 其 中 r 是 为 了 取得 首次 成 
功 所 需 进行 的 试验 次 数 。 例 如 ， 如 
果 想 求 出 P(X=20)， 那 么 就 可 以 用 
20 代 蔡 r， 这 样 就 能 迅速 求 出 概率 。 


= 0.2, 六 一 0.8. 


世上 没有 俐 问题 


阅 ;为 什么 用 字母 r 呢 ? 为 什么 不 
用 其 他 字母 呢 ? 


签 : 使 用 字母 [便于 将 结果 推广 
至 任何 特定 数值 ， 其 实 我 们 也 可 以 
用 其 他 字母 ， 不 过 常用 的 就 是 r。 


阅 : 如 果 可 能 出 现 的 结果 无 穷 无 
尽 ， 我 们 如 何 求 出 概率 分 布 ? 


每 :我 们 和 趟 用 为 了 得 出 概率 分 
市 而 一 一 列 出 每 一 种 可 能 结果 ， 关 
刍 在 于 通过 业 种 方式 档 述 每 一 种 可 
能 结果 ， 概 率 计 算 公式 就 是 这 样 一 
种 方式 。 


兄 何 分 布 、 二 项 分 布 及 泊 松 分 布 


宾 是 没 用 ， 
老 是 失败 二 抽 沾 > 


0D 
中 


二 


六 类 败 概 率 . 


要 率 ， 则 9A 代 


| 加 : 查 德 的 滑雪 技巧 难道 自 始 至 
终 都 不 会 提高 吗 ?说 每 一 次 试 滑 的 成 
功 概率 都 是 0 2， 这 现实 吗 ? 


答 : 你 的 想法 有 道理 。 不 过 在 
滑雪 问题 上 ， 查 德 实在 是 非常 倒 
零 ， 我 们 不 得 不 假定 他 的 技巧 没有 
提高 一 也 就 是 说 、 他 滑雪 成 功 的 概 
率 符 合 几 何 分 布 。 
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几何 分 布 细 细 看 


Dy 几何 方 齐 细 细 蔬 


我 们 说 过 . 查 德 的 滑雪 壮举 是 几何 分 布 的 一 个 实例 。 几 何 分 布 包含 以 下 条 
件 : 


人 。 进行 一 系列 相互 独立 的 试验 。 


从 每 一 次 试验 都 既 有 成 功 的 可 能 ， 也 有 失败 的 可 能 ， 且 单 次 试验 的 成 
功 概 率 相 同 。 


和 你 主要 感 兴趣 的 是 ， 为 了 取得 第 一 次 成 功 需要 进行 多 少 次 试验 。 


如 果 你 所 碰 到 求 概率 的 情况 满足 这 几 个 条 件 ， 那 么 就 可 以 用 几何 分 布 的 公 
式 帮 助 你 速 战 速决 。 这 里 有 一 个 重要 提示 : 我 们 用 了 “成 功 ” 这 个 词 表示 
我 们 感 兴趣 的 事件 成 为 事实 ， 假 如 我 们 希望 看 到 的 事件 具有 负面 含义 ， 从 
统计 学 的 角度 看 ， 这 个 负面 事件 仍然 可 算得 是 一 个 “成 功 ” 事 件 。 


让 我 们 用 变量 X 表 示 为 了 取得 第 一 次 成 功 所 需 进 行 的 试验 次 数 ， 即 ， 为 了 
让 我 们 感 兴趣 的 事件 发 生 而 需要 进行 的 试验 次 数 。 


为 了 求 出 X 取 特定 数值 t 的 概率 ， 可 以 用 下 式 进行 快速 计算 : 
P(X=r)=pq"" 


其 中 p 为 成 功 概率 ，q=1-p 为 失败 概率 。 即 ， 为 了 在 第 r 次 试验 时 取得 成 
功 ， 首 先 要 失败 (r-1) 次 。 


几何 分 布 的 形状 十 分 独特 。 


当 r=1 时 ，P{(X=z) 达 到 最 大 值 ， 随 着 r 增 大 ，P(X=D) 逐 
渐 下 降 。 注 意 ， 取 得 成 功 的 概率 在 第 一 次 试验 时 最 大 ， 
也 就 是 说 ， 尾 何 几何 分 布 的 众 数 都 永远 是 1， 因 为 1 是 
具有 最 大 概率 的 数 。 


P(X = x) 


虽然 看 似 有 违 直 觉 , 但 是 ,可 能 性 最 大 的 情况 却 是 : 
仅 需 尝试 一 次 即 可 成 功 。 
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几何 分 布 、 二 项 分 布 及 沿 松 分 布 





几何 分 布 对 不 等 式 同 样 有 有 


像 求解 几何 分 布 的 准确 概率 一 样 ， 对 于 涉及 不 等 式 的 概率 ， 也 有 一 种 简便 
的 求解 方法 。 


让 我 们 从 P(X > r) 讲 起 。 


P(X > r) 指 的 是 为 了 取得 第 一 次 成 功 需 要 试验 r 次 以 上 的 概率 。 为 了 让 需要 
进行 的 试验 次 数 大 于 r， 意 味 着 前 r 次 试验 必须 以 失败 告终 。 也 就 是 说 ,将 


ee 为了 让 得 得 记功 时 的 谍 验 次 数 大 村 必 有 领先 有 r 决 兴 仇 。 
P(X>rn)=qc i 
这 个 公关 中 系 壳 要 出 观 让 ， at 
更 要 确切 地 知道 哪 一 交底 验 是 站 人 


i4 了 ， 
我 们 可 以 利用 这 个 公式 求 出 P(X s 口 ， 即 为 了 取得 一 次 成 功 而 需要 尝试 r 次 只 要 知道 试验 次 数 党 须 大 了 "就 和 
或 r 次 的 以 下 概率 。 


如 果 将 P(X < 和 P(X > 口 相 加 ， 结 果 必 为 1， 即 ; 
P(Xsr+PIX>nm=1 
或 这 是 因为 P 公 Sm 与 PC > 四 是 两 各 对立 
P(X<r)=1- PX>r) 蝎 情 况 , PXSD = 1 -PC 人 > 站 


由 此 得 出 : 
以 上 式 可 知 , PX 之 7) 二 4 
P(X S r) 下 一 qq" 后 一 了 是 我 们 用 4 代 兰 PCK > 站， 得 出 这 个 公式 ， 


如 果 一 个 变量 X 的 概率 符合 几何 分 布 ， 且 单 次 试验 的 成 功 概 率 为 p， 则 可 


以 写作 ; 这 个 简明 志 达 并 的 意思 是 Rs 
何 分 大， 其 中 访 功 概率 为 P ，。 


X ~ Geo(p) 









我 已 经 磊 青 险 肿 了 | 你 
觉得 我 还 要 党 试 风 决 才能 
清 到 丫 呀 ? 


几何 期 望 


几何 分 布 前 期 望 模式 

前 面 已 经 求 出 查 德 为 了 成 功 滑 到 坡 底 而 党 要 试 滑 的 次 数 ， 但 如 果 乓 未 一 下 。 相亲 是 作 关 和 各 刘 
想 求 斯 望 和 方差 呢 》 知 道 期 望 用 处 很 多 ， 例 如 ， 在 数学 期 望 已 知 tn 
的 情况 下 ， 就 可 以 得 出 查 德 在 成 功 之 前 试 滑 次 数 的 期 望 值 。 是 提 


方 益 则 是 对 偏 卷 的 量度 ， 
还 记得 本 书 前 商 部 分 是 如 何 求 期 望 的 吗 ? E(X) 可 以 通过 ZxP(X=x) 
进行 计算 。 这 个 例子 有 无 穷 多 个 概率 。 不 过 ， 我们 可 以 先 算 算 前 
面 几 个 数值 看 看 是 否 存在 某 种 固定 模式 。 


下 面 是 x 的 前 几 个 数值 ， 其 中 X ~ Geo(0.2) 


这 是 xkFPWX 王 中 


P= 区 XP 区 |]K 的 i 和. 
lo | 
2 [oevoz=0% lo | | 
3 [osxozcolzg |o3t [0904 | 


4 [osxo2=01024 |04096 [13136 | 
5 |o8x0o2=008192 |04096 [17232 | 
6 |08rx02=0065536 |0.393216 [2.116416 
6 |0.87 x 0.2=0.04194304 | 0.33554432 [2.81894608 | 





能 看 出 xP(X = x) 的 特点 吗 ? 


xP{X=x) 的 数值 一 开始 很 小 ， 接 着 越 变 越 大 ， 直 到 x=5。 当 x 大 于 5 时 ， 数 值 
义 开始 减 小 ， 并 且 随 着 x 的 变 大 而 继续 减 小 。X 越 来 越 大 ，xP(X=x) 越 来 越 小 ， 
直到 几乎 不 能 使 累计 总 和 发 生变 化 。 


如 果 将 xP(X = x) 的 累计 总 和 画 成 图 形 ， 以 上 情况 会 看 得 更 加 清楚 : 


x) 


ExP{(X 5 
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几何 分 布 、 二 项 分 布 及 泊 松 分 布 


期 望 是 Vp 






将 xP(X = x) 的 累计 总 和 画 成 图 形 后 ,可 以 看 出 ， 随 着 x 变 大 ， 累 计 总 和 越 来 越 
接近 一 个 特定 数值 : 5。 实 际 上 ， 经 过 无 穷 多 次 试验 后 ，xP(X = x) 欧 累计 总 计 
正 是 等 于 5。 即 : 


你 是 说 五 次 之 内 
我 就 站 和 凋 成 功 ? 
示 壮 坏 啊 1 










E(X} = 5 


上 式 的 意义 很 直观 : 单 次 试验 的 成 功 概率 为 0.2， 可 以 理解 为 5 次 尝试 中 有 一 次 
尝试 趋向 于 成 功 ， 因 此 我 们 可 以 期 望 查 德 尝试 5 次 即 获 成 功 。 


以 上 情况 可 以 推 而 广 之 至 任意 数值 p。 如 果 X ~ Geo(p)， 则 ; 


期 里 等 于 1 除 必 蕊 功 模 府 
E(X) = 一 一 


我 们 不 仅 能 求 出 几何 分 布 的 期 望 ， 还 能 求 出 方差 。 


必 邑 芭 范 


让 我 们 看 看 是 不 是 能 用 求 期 望 的 同样 方式 求 出 几何 分 布 的 方差 
表达 式 。 填 写 下 表 ， 有 何 发 现 ? 


x [PX=%0 [lepX= 妇 epPXSso 
1 102 | | 
2 lo8x02=0%6 | | 
4 |08x02=01024 

5 

6 












记 信 ,方差 的 计算 方 
和议 E00) ~ :0%). 


0.8: x 0.2 = 0.08192 一 = 太一 4 
6 [0.8:x 0.2=0.065536 i 
了 |08ex02=00524288 | | | 





~ 


8 |0.87 x 0.2 = 0.04194304 
9 [0.8: x 0.2 = 0.033554432 
10 | 0.8s x 0.2 = 0.0268435456 
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心动 动 蕊 


A 解 管 让 我 们 看 看 是 不 是 能 用 求 期 望 的 同样 方式 求 出 几何 分 布 的 方差 
表达 式 。 填 写 下 表 ， 有 何 发 现 ? 











3 
本 | 
El 
6 
| 
[9 | 
10 | 


这 一 次 ，XxP(X =X) 和 不断 增加 ， 直 到 x 达 到 10。 当 x 达 到 10 之 后 ，xP(X=x) 再 次 开始 下 降 ， 







明 包 了 .就 是 说 xzP(X=x) 先 变 
大 一 隆子， 然后 ， 随 着 Xx 越 来 越 
大 ，xiP(X=x) 越 来 盐 小 。 


正 是 如 此 。 
x2P(X=x) 越 来 越 大 ， 直 到 达到 一 个 特定 值 ， 然 后 又 开始 减 小 ， 最 终 变 得 非常 接 


近 0。 





x2P(X = x) 
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求 当 前 分 布 的 方 芝 
以 上 分 析 如 何 帮 助 我 们 求 出 查 德 成 功 滑 到 坡 底 需 要 试 滑 的 次 数 的 方差 ? 
通过 下 式 可 算出 概率 分 布 的 方差 : 
Var(X) = E(X2) ~ E2(X) 
即 ， 算 出 Bx?P(X = x)， 减 掉 E(X) 的 平方 ， 以 x 为 横 轴 画 出 所 得 结果 的 图 


形 ， 这 时 可 以 看 出 Var(X) 的 模式 是 : 随 着 x 上 升 而 上 升 。 下 面 是 x?P(X < 
x) - Ex(X) 的 图 形 。 


20 


X2P(X < x) - E2(X) 


随 着 x 变 大 ，x?P(X < x) - Ez(X) 越 来 越 接近 一 个 特定 数值 ， 这 里 是 20。 
和 讨论 数学 期 望 的 时 候 一 样 ， 方 差 的 规律 归结 如 下 。 如 果 X ~ Geo(p)， 则 


几何 分 布 、 二 项 分 布 及 泊 松 分 布 






望 和 方差. 


即使 试 清 次 数 未 固定， 还 是 能 算出 期 
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几何 分 布 速 查 表 


几何 分 布 简明 指南 


下 面 是 有 关 几 何 分 布 的 简明 总 结 ， 你 可 能 用 得 上 : 


何 时 使 用 几何 分 布 ? 


进行 多 次 相互 独立 的 试验 时 可 使 用 几何 分 布 ， 每 一 次 试验 都 存在 成 功 或 失败 的 可 能 ， 而 你 感 兴趣 的 是 为 了 


取得 第 一 次 成 功 需要 试验 多 少 次 。 
如 何 计算 概率 ? 


可 使 用 以 下 方便 易 用 的 公式 。P 为 单 次 试验 的 成 功 概率 ，q=1-p，X 是 为 了 取得 第 一 次 成 功 而 需要 试验 的 次 


数 . 这 时 我 们 说 X ~ Geo(p)。 
P(X=r)=pq"!' 


在 第 r 次 试验 时 取得 
第 一 次 成 功 的 概率 。 


如 何 计算 方差 和 期 望 ? 
公式 如 下 : 


E(X) = 1/p 


阅 : ”这 些 公式 可 靠 吗 ? 任何 时 候 


都 能 用 来 求 概率 和 期 望 吗 ? 
答 :只 要 是 几何 分 布 ， 就 可 以 


用 这 些 速 算 公 式 ， 因 为 这 些 公式 正 
是 针对 几何 分 布 的 简便 算法 。 如 果 


所 处 理 的 问题 不 符合 几何 分 布 模型 ， 


那么 不 要 用 这 些 简 便 算法 。 

别 忘 了 ， 几 何 分 布 的 应 用 条 件 是 : 
进行 多 次 相互 独立 的 试验 (因此 每 
次 试验 的 概率 保持 不 变 ) ， 每 一 次 


试验 都 存在 失败 或 成 功 的 可 能 性 ， 


而 你 感 兴趣 的 是 : 为 了 取得 第 一 次 
成 功 需要 进行 多 少 次 试验 。 
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P(X>7)=qr 


庆 关 庚 夫 坟 忆 下手 入 和 
得 第 一 次 成 功 的 概率 ， 


世上 没有 傻 问 题 


阅 :。 如 果 是 其 他 情况 呢 ? 例如 斌 
验 次 数 一 定 ， 要 求 成 功 次 数 呢 ? 


答 : 不 能 使 用 几何 分 布 ， 你 说 
的 情况 不 符合 几何 分 布 的 模型 。 不 
过 别 担心 ， 会 有 其 他 方法 的 。 


| 问 : 我 要 把 这 些 速算 法 都 学 会 吗 ? 


答 ; 如 果 你 要 处 理 几 何 分 布 问 
题 ， 知 道 这 些 公式 会 大 大 节省 你 的 
时 间 ; 如 果 你 是 为 了 参加 统计 学 考 
试 ， 那 么 看 看 考试 大 岗 是 否 要 求学 
会 这 些 内 容 。 


P(X <r)=1-q" 


A 次 或 系 到 r 次 即 可 
取得 第 一 次 总 功 购 概率 ， 


Var(X) = q/p: 





阅 : 为 什么 几何 分 布 用 到 p 和 和 q? 


答 : p 代 表 英 文 单词 “probabi- 
lity”， 即 “概率 ”， 在 几何 分 布 中 ， 
代表 的 是 单 次 试验 的 成 功 概率 。q 在 
统计 学 中 往往 代表 1-p， 也 就 是 p'。 
本 章 以 及 本 书后 文 将 会 大 量 出 现 这 此 
字母 


几何 分 布 、 二 项 分 布 及 深 松 分 布 


化 身 涌 雪 者 


另 一 位 少 省 者 不 出 发 外 须 和 清 玛 
粮 搬 的 模 涯 是 0.4。 你 的 任务 龙 
您 长 自己 是 迁 位 清 倪 者， 算出 勾 
下 情况 下 的 粳 军 。 







1. 第 一 次 滑雪 失败 ， 第 二 次 滑雪 成 功 的 概率 。 


2. 第 4 次 或 不 足 4 次 就 滑雪 成 功 的 概率 。 


3. 4 次 以 上 才能 获得 成 功 的 概率 。 


4. 你 所 期 望 的 为 了 获得 成 功 而 需要 试 滑 的 次 数 。 


5. 试 滑 次 数 的 方差 。 
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化 身 滑雪 者 解答 


化 身 滑 雪 省 解 管 


另 一 位 清 雪 省 不 出 意外 顺利 清 至 

煤 展 的 模 地 龙 0.4。 你 的 任务 是 
您 葡 自 己 是 逊 位 深 当 者 ， 算 出 以 
下 情况 下 的 禄 率 . 







1. 第 一 次 滑雪 失败 ， 第 二 次 滑雪 成 功 的 概率 。 
PX=2)=Pxa 
一 0.4x0.6 
= 0.24 


2. 第 4 次 或 不 足 4 次 就 滑雪 成 功 的 概率 。 
PXS4)=1-a’ 
= 1—0.6° 
一 1 了 -0.1296 
= 0.8704 


3. 需要 滑雪 4 次 以 上 才能 获得 成 功 的 概率 。 


PX>4)=a 
或 者 可 以 这 样 书 ， 
一 0.6 
= 0.1296 P(X>4)=1-P(X<4) 


= 1~ 0.8704 = 0.1296 
4. 你 所 期 望 的 为 了 获得 成 功 而 需要 试 滑 的 次 数 。 
EX) = 1/p 
= 1/0.4 


一 2.5 


5. 试 滑 次 数 的 方差 。 
Var(X) = aq/p’* 

= 0.6/0.4= 

= 0.6/0.16 
一 3.75 
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让 我 们 使 用 义 一 Ge0(0.4) 进 行 
解答 ， 其 中 X 为 这 位 滑雪 者 
为 了 顺利 滑 至 坡 交 而 需要 经 
历 的 试 滑 次 数 。 


几何 分 布 、 二 项 分 布 及 泊 松 分 布 





让 我 们 滑 起 来 ! 






你 已 经 掌握 了 几何 分 布 

多 亏 你 懂得 几何 分 布 这 门 技 术 ， 查 德 不 仅 知 道 自己 在 试 滑 多 少 次 之 
后 可 能 成 功 滑 到 坡 底 的 概率 ， 还 能 知道 他 能 够 期 望 自己 滑 多 少 次 就 
获得 成 功 ， 以 及 存在 多 大 变数 

只 要 试 滑 5 次 就 能 成 功 滑 至 坡 底 ， 方差 为 20， 这 样 的 期 望 让 他 倍增 自 
言 -一 他 不 用 伤痕 累累 就 能 让 那些 美女 刮目相看 了 


继续 前 进 ……- 












女士 们 ， 先 生 们 ， 
钨 我 打 断 ， 次 油 观 
著 统 计 郑 涩 门 御 力 
游戏 节日 : 
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cr 欢迎 观看 统计 邦 热 门 节 
“和 . 今 晚 我 们 准备 
些 搞怪 难题 ， 硕 电 您 福星 高 败 . 











今天 我 们 可 范 么 准备 了 未 少 玲 题 ， 瑰 在 开始 ! 第 一 范 3 个 
问题 ， 每 个 问题 十 4 个 备 选 答案 ， 冶 可 以 观 在 就 带 着 玄 励 奖 
离 场 ， 也 可 以 选择 娃 凌 ， 击 艇 对 手 进 入 下 一 元 后 ， 你 就 高 
转椅 这 了 一 步 ， 第 一 轮 : “关于 我 ”。 祝 您 将 还 1 








下 面 是 第 一 轮 的 提问 ， 都 是 关于 游戏 主持 人 
的 问题 。 请 在 正确 答案 旁边 打 勾 。 


世上 没有 俐 问题 
问 ; ” 讲 到 一 半 来 个 智力 游戏 干什么 ? 还 是 接着 讨论 概 奖 * ”我 不 知道 这 些 问 题 的 答案 ， 怎 么 办 ? 
率 分 布 吧 。 答 


不 知道 答案 可 以 随机 答 鸣 ， 好 好 猜 吧 ， 有 可 能 
还 是 在 讨论 着 。 智 力 游 戏 是 另 一 种 概率 分 布 的 ”得 大 奖 呢 。 
理想 案例 ， 读 下 去 你 就 会 明和 白 的 。 
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帮 售 分 布 、 二 壬 分 布 及 泊 松 分 布 


玩 下 去 ， 还 是 转身 走 ? 


你 不 太 可 能 对 游戏 主持 人 那么 了 解 ， 所 以 这 些 问题 应 该 是 答 不 上 来 的 。 所 
以 ， 让 我 们 看 看 ， 如 果 随 机 回答 问题 ， 是 否 能 求 出 答对 的 题 数 的 概率 分 布 ， 
这 会 帮助 你 决定 是 玩 下 去 还 是 转身 走 。 


间 题 3 
这 是 3 个 问题 的 概率 树 。 
i 问题 2 0.25 正确 
0.25 ”正确 
0.75 i 
正确 0.25 正确 
0.75 
= ~ 去 二 
0.75 
0.25 正确 
0.75 0.25 “正确 
0.75 Wi 
锚 误 
0.25 正确 
0.75 
错误 < 一 
0.75 


这 类 问题 的 概率 是 多 大 ? 可 以 看 出 什么 规律 ? 用 X 代 表 答对 的 
题 数 ， 共 3 题 。 
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“WE、 解 带 这 类 问题 的 概率 是 多 大 ? 可 以 看 出 哪 种 模式 ? 用 X 代 表 答对 的 


题 数 ， 共 3 题 。 





答对 一 题 哆 情况 5 问题 3 
有 3 种 ， 春 一 种 问题 1 问题 2 ; 正确 
Em 
0.752 x 0.25, 0.25 
0.75 
错误 
正确 0.25 正确 
0.25 0.75 a 
0.75 柑 误 
0.25 正确 
0.75 0.25 正确 
0.75 
0.25 正确 
0.75 







0.75 氏 误 


请 复习 第 6 章 “ 排 列 与 组 合 ” 。 你 觉得 对 解决 这 类 问题 
有 帮助 吗 ? 





答对 一 题 的 几率 为 2 名， 答对 
两 题 的 几率 为 14 各 ， 肤 算 不 岁 。 
我 建议 继续 入 下去， 
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几何 分 布 、 二 项 分 布 及 泊 松 分 布 


推广 到 求 3 个 问题 的 概 字 
前 面 讲 到 了 X 的 概率 分 布 ，X 为 答对 的 题 数 ， 总 共 3 题 。 


与 几何 分 布 一 样 ， 这 里 的 福 率 似乎 也 有 某 种 模式 。 每 一 种 概率 都 含有 
0.75 和 0.25 的 寡 ， 随 着 x 增 大 ，0.75 的 宅 减 小 ， 而 0.25 的 寡 增 大 。 


一 般 ，P(X = 了 如 下 计算 : 
急 诞 类 的 答对 梳 率 . 
P(X = r) = 2 0.25' x 0.751” 。 闪 是 
下 


答 数 ， 
r 是 答对 的 题 这 是 颁 么 ， er 


即 ， 为 了 求 出 答对 r 题 的 概率 ， 可 算出 0.25"， 乘 以 0.75:'7， 然 后 将 以 上 结 
果 乘 以 某 个 数值 。 这 个 数值 是 多 少 呢 ? 


纵 少 的 数字 是 哪 一 个 ? 


对 于 每 一 种 概率 ， 我 们 需要 答对 一 定数 目的 问题 ， 而 答对 一 定数 目的 问 
题 的 方式 不 止 一 种 。 例 如 ,总 共 3 题 ， 答 对 其 中 任意 一 题 的 情况 有 3 种 。 
还 可 以 这 样 理解 : 存在 3 种 不 同 的 组 合 。 

第 6 章 介 络 了 这 种 情况 ， 
提醒 一 下 : 组 合 "Cr 即 从 n 个 对 象 中 选取 5 个 对 象 的 选取 方式 数目 (不 需要 -一 一 从 要 时 请 复习 一 下 。 
知道 确切 的 选取 顺序 )。 这 正 是 我 们 现在 碰 到 的 情况 ， 我 们 涡 要 从 3 个 问 
题 中 选取 r 个 答对 的 问题 。 

即 ，3 题 中 答对 r 题 的 概率 可 以 这 样 计算 : 


P(X = r)=’?C. x 0.25" x 0.75 






因此 ， 根 据 这 个 公式 ， 答 对 1 题 的 概率 为 : 





让 我 们 看 厦 你 在 第 
一 轮 一 “关于 我 ” 
中 的 表现 ， 


P(X =r) =C, x 0.25 x 0.75 






= 31/(3-1)! x 0.25 x 0.5625 
= 6/12 x 0.0625 x 0.75 


=0.422 < 一 一 这 和 上 一 页 用 图 表 算 
出 隶 的 结果 一 样 。 














看 来 你 和 别 网 好 手 系 榈 上 
下 . 茶 喜 ， 你 音 级 了 。 
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也 售 分布 、 二 项 分 布 及 泊 松 分 布 






“ 转 襟 赢 赢 赢 ”第 二 轮 : 懂 我 多 一 些 . 这 一 轮 有 5 个 
问题 ， 每 个 问题 有 4 个 备 先 答案， 要 继续 吗 ? 


六 蕊 将 





下 面 是 第 二 轮 的 提问 ， 都 是 关于 游戏 主持 人 的 问题 。 


隐 


看 来 这 些 问题 还 是 和 上 一 轮 一 样 难 狂 ， 所 以 还 是 要 赁 运气 。 
让 我 们 看 看 能 不 能 算出 这 些 新 问题 的 概率 分 布 。 
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进一步 推导 概率 算式 


前 面 讲 过 ， 答 对 3 个 问题 中 的 r 个 问题 的 概率 是 : 
P(X = r) = 3C, x 0.25' x 0.75 


其 中 ，0.25 为 每 道 题 的 答对 概率 ，0.75 为 每 道 题 的 答 错 概率 。 

第 二 轮 “ 转 椅 赢 赢 赢 ”有 5 个 问题 ， 而 不 是 3 个 。 我 们 就 不 重新 计算 5 个 
问题 的 解法 了 一 让 我 们 求 出 n 个 问题 的 解法 ， 这 样 就 能 用 同一 个 公式 
解决 每 一 轮 “ 转 椅 赢 赢 赢 ” 的 问题 。 


那么 用 哪个 公式 计算 答对 n 个 问题 中 的 r 个 问题 的 概率 呢 ? 请 看 : 


用 nw 代 著 3 就 是 了 . 


P(X = r) = "C, x 0.25"' x 0.75"™" 












风 果 每 通 题 易 答 对 概率 发 生变 化 ， 
这 时 该 怎么 办 ? 我 在 想 是 不 是 能 进 一 
步 归 纳 出 计算 公 苹 ， 


没 错 ， 可 以 进行 归纳 。 
设想 每 道 题 的 答对 概率 是 p， 而 每 道 题 的 答 错 概率 是 1-p， 也 就 是 q 
答对 n 个 问题 中 的 r 个 问题 的 概率 为 : 


P(X=r)="C. xPp'xq"" 


这 类 问题 称 为 二 项 分 布 ， 让 我 们 仔细 看 看 。 
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几何 分 布 、 二 项 分 布 及 泊 松 分 布 


Yn 
= 



























猜测 “转椅 赢 赢 霹 ”各 种 问题 的 答案 是 二 项 分 布 的 一 个 实例 ， 
分 布 包 括 下 列 条 件 : 


你 正在 进行 一 系列 独立 试验 。 


每 一 次 试验 都 存在 失败 和 成 功 的 可 能 ， 每 一 次 试验 的 成 功 概 率 
相同 。 


办 试验 次 数 有 限 。 





这 个 条件 有 变化 . 


和 几何 分 布 的 情况 一 样 ， 你 要 进行 一 系列 独立 试验 ， 每 一 次 试验 结果 
或 成 功 或 失败 。 差 别 在 于 这 一 次 你 感 兴趣 的 是 获得 成 功 的 次 数 。 


让 我 们 用 X 表 示 “n 次 试验 中 的 成 功 次 数 ”， 为 了 求 出 取得 r 次 成 功 的 
概率 ,可 用 下 列 算式 : 





P(X = 7) ="C, prq 


P 是 每 一 次 试验 的 成 功 概率 ,，n 是 试验 次 数 。 写 作 : 


X ~ Btn, p) 







根据 n 与 p 的 不 同 数值 ， 二 项 分 布 的 形状 会 发 生变 化 ，p 
越 接近 0.5， 图 形 越 对 称 。 一 般 情况 下 ， 当 p 小 于 0.5 时 ， 
图 形 向 右 偏 斜 ， 当 P 大 于 0.5 时 ， 图 形 向 左 偏 任 。 
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期 望 和 方 关 如何 计算 ? 


前 面 讲 过 如 何 使 用 二 项 分 布 计 算 基 本 概率 ， 由 此 我 们 可 以 算出 答对 一 定数 
目的 问题 的 概率 。 但 是 ， 如 果 答 案 是 随机 选择 的 ， 那 么 我 们 到 底 能 期 望 自己 
答对 几 个 问题 呢 ? 算出 期 望 可 以 帮助 你 作出 更 正确 的 选择 ， 以 恒 决 定 是 否 参 
加 下 一 轮 问题 的 回答 。 


让 我 们 看 看 能 否 求 出 期 望 和 方差 的 常规 表达 式 。 我 们 先 算 单 次 试验 的 期 望 和 
方差 ， 然 后 看 看 是 否 能 推广 至 n 次 独立 的 试验 。 


先 需 单 次 试验 
假定 我 们 只 试验 一 次 。 每 一 次 试验 或 是 成 功 ,或 是 失败 ， 因 此 ， 在 单 次 一 一 


试验 时 ， 有 可 能 取得 0 次 或 1 次 成 功 ， 如 果 X~B(1,p)， 则 成 功 1 次 的 概率 
为 p， 成 功 0 次 的 概率 为 q。 


这 是 X 网 槛 率 分 这 ， 
义 符合 X 一 官 (1 了 P)。 


我 们 可 以 根据 以 上 条 件 求 出 X 的 期 望 和 方差 .让 我 们 先 算 期 望 。 


E(X) = 0q + 1p 
= 池 
Var(X) = E(X] - EX 必 ” EX) = Pp seoEOo =P 
= (0q + lp) - p: 
时 Pp i p* 
= Pp(1- p) 
= pq 
因此 ， 单 次 试验 的 E(X) = p，Var(X) = pq。 那 么 n 次 试验 呢 ? 


他 动 盐 及 


一 般 情况 下 ， 如 果 有 nn 个 独立 观察 结果 ， 那 么 期 望 和 方差 是 多 少 ? 在 本 例 中 对 我 们 有 何 帮助 ? 


EX’) 
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疹 妙 池 


让 我 们 看 看 你 是 否 能 推导 出 Y ~ B(n, p) 
的 期 望 和 方差 。 你 的 任务 是 从 奇妙 
池 中 捞 出 公式 因子 ， 将 这 些 因 子 放 
入 计算 式 中 的 横 线 上 。 每 个 因子 只 
能 用 一 次 ， 不 必 使 用 所 有 因子 。 





E(X) = E(X) + E(X2) + … + E(X,) 


Var(X) = Var(X,) + Var(X,) + … + Var(X ) 


= Var(X) 


注意 : 池 中 的 每 个 因子 
只 能 用 一 次 。 


mm 


提示 : 每 个 X 是 二 次 单独 的 试验 。 
E(X)= p，Var(X) = pq。 

你 需要 求 出 n 个 独立 试验 的 期 望 和 
方差 。 
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疹 妙 池 解 答 


让 我 们 看 看 你 是 否 能 推导 出 Y ~ B(n, p) 提示 : 每 个 X 是 一 次 单独 的 试验 。 
的 期 望 和 方差 。 你 的 任务 是 从 奇妙 ELAS ,VartKy = pa 

池 中 捞 出 公式 因子 ， 将 这 些 因子 放 你 需要 求 出 n 个 独立 试验 的 期 望 和 
入 计算 式 中 的 横 线 上 。 每 个 因子 只 

能 用 一 次 ， 不 必 使 用 所 有 因子 。 





由 于 斌 时 孙 辫 的 ， 因 此 ， 1) 三 E(Xa) 三 所 (X) 以 比美 
E(X) = E(X) + EX) .+ ElX) 于 旋 验 是 独立 的 ， 因 此，E(X+) = 5E(Xz) = E(X) ,以 此 类 推 . 


= nm  E(X) 
本 中 NR 
风 果 X 一 已 (mwT)， 则 E(X) 
Var(X) = Var(X,) + Var(X,) + ... + Var(X ) Mp MA vo 
= mn Var(X) 


= Npq 


由 于 令 验 是 釉 立 哆 ， 因 此 Var(X,) = Var(X,) = Var(X,) ， 以 此 类推 ， 








站 


n2 
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二 项 分 布 的 期 望 与 方 莽 


让 我 们 归纳 一 下 前 面 做 过 的 分 析 。 首 先 看 单 次 试验 的 情况 : 单 次 试验 
的 成 功 概率 为 p， 符 合 二 项 分 布 。 根 据 这 些 条 件 ， 我 们 求 出 了 单 次 试 


验 的 期 望 和 方差 。 


然后 我 们 分 析 了 mn 个 独立 试验 的 情况 ， 并 利用 简便 方法 求 出 了 n 次 试验 
的 期 望 与 方差 。 我 们 发 现 ， 只 要 X ~ Btn, p)、 则 ; 


E(X) = np 


这 雌 公 


几何 分 布 、 二 项 分 项 及 深 松 分 布 


浆 对 前 有 一 


项 今 布 都 或 立 ， 


Var(X) = npq 


得 出 这 个 结论 十 分 有 用 ， 因 为 这 样 一 来 ， 我 们 不 用 大 量 计算 单个 概率 ， 
就 能 迅速 求 出 任何 二 项 概率 分 布 的 期 望 和 方差。 


阅 :几何 分 布 和 二 项 分 布 看 着 很 
相似 。 它 们 有 区 别 吗 ? 分 别 应 该 在 什 
么 时 息 用 昵 2 


答 : 几何 分 布 和 二 项 分 布 确实 
有 共同 之 处 ， 二 者 处 理 的 都 是 独立 
试验 ， 每 次 试验 都 或 是 成 功 ， 或 是 
失败 。 差 别 在 于 实际 上 要 求 的 结果 。 
在 哪 种 情况 下 使 用 哪 种 概率 分 布 取 
决 于 要 求 的 结果 。 


如 果 试 验 次 数 固定 ， 求 成 功 一 定 次 
数 的 概率 ， 则 需要 使 用 二 项 分 布 ; 
使 用 二 项 分 布 还 可 以 求 出 在 n 次 试验 
中 能 够 期 望 取得 的 成 功 次 数 。 

和 如果 你 感 兴趣 的 是 在 取得 第 一 次 成 
功 之 前 需要 试验 多 少 次 ， 则 需要 使 
用 几何 分 布 。 


世上 没有 俐 问题 


阅 : 几何 分 布 是 有 众 数 的 ， 二 项 
分 布 有 众 数 吗 ? 


答 : 有 的 。 一 个 概率 分 布 的 众 
数 就 是 具有 最 高 概率 的 数值 ， 和 如果 
Pp 为 0.5 且 n 为 偶数 ， 则 众 数 为 np; 如 
果 p 为 0.5 且 n 为 奇数 ， 则 该 概率 分 布 
有 两 个 众 数 ， 即 位 于 np 左右 两 侧 的 
两 个 数值 。 对 于 其 他 n 值 和 p 值 ， 划 
需要 通过 反复 试 算 的 方法 求 众 数 ， 
但 一 般 都 非常 接近 np。 


多 :。 几何 分 布 和 二 项 分 布 都 要 进 
行 大 量 试验 ， 每 一 次 试验 的 成 功 概率 
都 必须 一 样 吗 ? 


签 ; 为 了 能 应 用 几何 分 布 和 二 
项 分 布 ， 每 一 次 试验 的 成 功 概 举 都 
必须 相同 。 如 果 不 满足 这 个 条 件 ， 
则 无 论 是 几何 分 布 还 是 二 项 分 布 都 
不 适用 。 


说 :我 试 着 算出 了 E(x)， 但 所 得 
结果 不 是 概率 分 布 中 的 数值 。 我 哪里 
做 错 了 吗 ? 


答 : 计算 E(X) 的 时 候 ， 结 果 有 
可 能 不 是 概率 分 布 中 的 可 能 数值 ， 
即 ， 结 果 有 可 能 不 是 一 个 会 实际 出 
现 的 数值 。 得 出 这 样 的 结果 并 不 表 
示 你 算 错 了 ， 别 担心 。 


交 : 还 有 其 他 类 型 的 概率 分 布 吗 ? 


签 : 有 。 接 着 读 吧 ， 更 多 的 内 
窜 在 等 着 你 。 
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二 项 分 布 集 明 指南 

下 面 是 有 关 二 项 分 布 的 简明 总 结 ， 你 可 能 用 得 上 : 

何 时 使 用 二 项 分 布 ? 

进行 次 数 固定 的 独立 试验 时 可 使 用 二 项 分 布 ， 这 时 ， 每 一 次 试验 都 存在 成 功 或 失败 的 可 能 ， 而 你 感 兴趣 的 
是 成 功 或 失败 的 次 数 。 

如 何 计 算 概 率 ? 


公式 为 : ni 


C, = 一 一 一 
rl (n -~ r)! 
其 中 p 为 单 次 试验 的 成 功 概率 ，q = 1 - p，n 为 试验 次 数 ，X 为 在 n 次 试验 中 取得 的 成 功 次 数 。 


P(X=r)="C, p'q"-" 


期 望 和 方差 如 何 计算 ? 


E(X) = np Var(X) = npq 





302 深入 浅 出 统计 学 


几何 分 布 、 二 项 分 布 及 灌 松 分 布 


最 后 一 轮 “ 转 椅 赢 赢 启 ”游戏 中 共有 5 个 问题 ， 每 一 题 的 答对 概率 是 0.25。 





1. 答对 两 题 的 概率 是 多 少 ? 


DN 


. 答对 3 题 的 概率 是 多 少 ? 


《D 


. 答对 两 题 或 3 题 的 概率 是 多 少 ? 


> 


. 一 题 也 答 不 对 的 概率 是 多 少 ? 


5. 期 望 和 方差 是 多 少 ? 
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最 后 一 轮 “ 转 椅 井 赢 赢 ”游戏 中 共有 5 个 问题 ， 每 一 题 的 答对 概率 是 0.25。 


本 习 
解答 


1. 答对 两 题 的 概率 是 多 少 ? 
如 果 X 代 表 答 对 的 题 数 ， 则 X 一 已 (mw P): 


P(X = 2) 一 5 x 0.25* x 0.75? 





x 0.0625 x 0.421875 
3121 


= 10 x 0.0264 
= 0.264 
2. 答对 3 题 的 概率 是 多 少 ? 
P(X = 3) = ?0, x 0.25? x 0.75? 
1 


5! 
= x O.015625 x 0.5625 
213t 





= 10 x 0.00879 


一 0.0879 


3. 答对 两 题 或 3 题 的 概率 是 多 少 ? 
P(X=2 误 X=3)=PX= 2)+P(X = 3) 


= 0.264 + 0.0879 
这 人 么 说 你 只 能 期 吾 


答对 未 到 2 个 问题 ? 一 0.3519 
我 想 规 在 是 退出 的 本 
有 时候 了 可惜 啊 ， 4. 一 题 也 答 不 对 的 概率 是 多 少 ? 
你 赢 未 到 转椅 了 。. P(X = 0) = 0.75 


= 0.237 





D 


5. 期 望 和 方差 是 多 少 ? 


E00) = np Varbo = wpa 
三 上 $x 0.25 =5 x0.25 x 0.75 
一 1.25 = 0.9375 
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几何 分 布 、 二 项 分 布 及 泊 松 分 布 








您 印 参 加 这 决 若 力 网 戏 真 是 太 妆 了， 和希 萌 您 下 次 


再 亲 。 对 了 ， 说 计 邦 电影 院 刚 才 给 我 们 来 了 一 个 
电话 ， 爆 米花 出 了 点 问题 ? 
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认识 泊 松 分 布 


统计 孝 电影 院 遇 到 了 问题 
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我 的 爆 米 纶 呢 ? 
我 现在 就 要 爆 米 花 1 
马上 要 | 

















众所周知 ， 看 电影 怎么 少 得 了 爆 米 花 
问题 出 在 爆 米 花 机 上 ， 统 计 邦 电影 院 的 爆 米 花 机 总 是 坏 ， 顾客 们 很 不 高 兴 。 


下 星期 电影 院 有 一 个 大 型 促销 ， 影 院 经 理 希望 一 切 都 完美 无 缺 。 他 可 不 
想 让 爆 米花 机 在 下 星期 坏 掉 ， 否 则 就 再 也 没 人 来 看 电影 了 。 


爆 米花 机 每 一 周 的 平均 故障 次 数 为 3.4， 或 者 说 爆 米花 机 的 故障 率 为 3.4。 
爆 米花 机 下 一 周 不 发 生 故 障 的 概率 有 多 大 ? 


如 果 预 期 下 一 周 爆 米花 机 会 发 生 多 次 故障 ， 则 统计 邦 电影 院 会 买 一 台 ; 
爆 米 花 机 ; 如 果 预 期 不 会 发 生 故障 ， 他 们 将 继续 使 用 现在 这 台 机 器 ,但 
同时 要 承担 机 器 故障 的 风险 。 

这 是 另 一 种 分 布 

这 次 的 问题 与 我 们 前 面 遇 到 过 的 问题 不 同 。 

这 一 次 不 存在 一 系列 的 试验 ， 相 反 ， 这 一 次 的 情况 是 这 样 的 : 已 知 故障 
的 发 生 几 率 ， 且 该 故障 是 随机 发 生 的 。 

那么 我 们 如 何 求 出 概率 ? 


这 一 类 问题 的 难点 在 于 ， 尽 管 我 们 知道 爆 米 花 机 每 周 的 平均 故障 次 数 ， 
但 实际 的 故障 次 数 却 不 是 固定 的 。 从 总 体 上 看 ,我 们 可 以 期 望 的 故障 次 
数 是 每 周 3 或 4 次 ， 但 在 倒霉 的 某 一 周 ， 故 障 会 多 得 多 ， 而 在 顺利 的 某 一 
周 ， 故 障 则 根本 不 会 发 生 。 


我 们 需要 求 出 爆 米花 机 下 周 不 发 生 故 障 的 概率 。 


听 起 来 挺 难 吧 ? 别 担心 ， 有 一 种 概率 分 布 是 专门 用 来 应 付 这 种 情况 的 ， 
叫做 泊 松 分 布 。 


用 何 分 布 、 二 项 分 布 及 泊 松 分 布 


泊 粘 分 刘 细 细 趾 
泊 松 分 布 包 括 以 下 条 件 : 


和 单独 事件 在 给 定 区 间 内 随机 、 独 立地 发 生 ， 给 定 区 间 可 以 是 时 间 
或 空间 ， 例 如 可 以 是 一 个 星期 ， 也 可 以 是 一 英里 。 





























息 已 知 该 区 间 内 的 事件 平均 发 生 次 数 ( 或 者 叫做 发 生 率 》， 且 为 有 
限 数值 。 该 事件 平均 发 生 次 数 通常 用 希腊 字母 X (lambda) 表示 。 





让 我 们 用 X 表 示 给 定 区 间 内 的 事件 发 生 次 数 ， 例 如 一 个 星期 内 的 损坏 次 
数 。 如 果 X 符 合 泊 松 分 布 ， 且 每 个 区 间 内 平均 发 生 入 次 ， 或 者 说 发 生 率 
为 入 ， 则 写作 : 

X ~ Po(》) 





我 们 就 不 在 这 里 进行 推导 了 。 在 求 给 定 区 间 内 发 生 r 次 事件 的 概率 时 ， 


请 使 用 下 式 进行 计算 : | 
列 撤 表面 现象 咱们 了 ， 家 


二 计算 方法 十 分 移 单 直接 。 


< 征 一 个 数 党 常数 ， 


























这 个 求 概率 的 公式 用 到 了 指数 函数 e*，x 是 未 知 数 。 大 部 分 计算 器 都 有 这 ee 
未 ; 空 把 这 
个 标准 函数 ， 因 此 虽然 这 个 公式 看 起 来 很 复杂 ， 实 际 应 用 却 非常 简单 。 全 和 澳 公共 吉村 了 了， 
例如 ， 如 果 X ~ Po(2)， 则 : a We 
健 用 这 个 公关 从 以 键 ， 可 " 收 和 用 运 
e-2 x 23 be ,=3, =2, 链 计 算 z 的 替 。 


P(X = 3) = 


3! 


e272x8 





6 
=e? x 1.333 
= 0.180 
那么 ， 如 果 X 符 合 泊 松 分 布 ， 其 期 望 和 方差 如 何 ? 答案 比 你 想像 的 可 


errrs 
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求解 泊 松 分 布 的 期 望 和 方差 


汉 松 分 布 的 期 望 和 方差 
求 泊 松 分 布 的 期 望 和 方差 比 求 其 他 分 布 的 期 望 和 方差 更 容易 。 


如 果 X~ Po{ X )， 则 E(X) 为 我 们 在 给 定 区 闻 内 能 够 期 望 的 事件 发 生 次 数 ， 
对 于 爆 米 花 机 来 说 ， 则 为 我 们 在 普通 的 一 周 内 能 够 期 望 的 机 器 损坏 次 数 ， 
也 就 是 说 ，E(X) 是 给 定 区 间 内 的 事件 平均 发 生 次 数 。 


现在 ， 如 果 X~Po(xX)， 则 事件 平均 发 生 次 数 以 入 表示 ， 即 E(X) 等 于 和 ， 这 
个 参数 决定 了 我 们 的 泊 松 分 布 。 


泊 松 分 布 ( 相 较 其 他 分 布 》 更 简洁 的 地 方 在 于 ， 它 的 方差 也 是 入 ， 因 此 ， 
如 果 X ~ Po( 和)， 则 : 
E(X) = 入 Var(X) = 入 


即 ， 如 果 给 你 一 个 泊 松 分 布 Po( 入 )， 你 根本 不 用 做 任何 计算 就 能 得 出 期 户 
和 方差 一 泊 松 分 布 的 参数 本 身 就 是 期 望 和 方差。 


治 松 分 布 是 何 形状 ? 


泊 松 分 布 的 形状 随 着 入 的 数值 发 生变 化 。X 小 ， 则 分 布 向 右 偏 斜 ， 随 着 
变 大 ， 分 布 逐 渐变 得 对 称 。 


如 果 入 是 一 个 整数 ， 则 有 两 个 众 数 ， 和 和 入 -1， 如 果 入 不 是 整数 ， 则 众 数 
为 入 。 






兆 检 


P(X = x) 
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我 会 让 你 对 治 松 今 
市 了 如 指 索 : 期 户 ， 
方差 ， 一切. 





化 秃 爆 米花 机 


你 的 任务 是 您 薄 自己 是 爆 米 
花 宙 ， 并 说 出 你 在 下 一 周 的 
一 个 特定 时 间 段 内 发生 内 障 
的 模 举 。 记 住 ， 你 洛 生 损 环 
的 平均 次 次 是 每 周 3.4 次 ， 





1. 下 一 周 爆 米 花 机 不 发 生 故 障 的 概率 是 多 少 ? 


2. 下 一 周 爆 米花 机 发 生 3 次 故障 的 概率 是 多 少 ? 


3. 爆 米 花 机 发 生 故 障 的 期 望 和 方差 是 多 少 ? 


几何 分 布 、 二 项 分 布 及 泊 松 分 布 
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化 身 爆 米 花 机 解答 


化 身 爆 米花 机 解答 


你 的 任务 是 像 长 自己 是 爆 米 

花 机 ， 并 说 出 你 在 下 一 周 的 让 我 们 用 X 代 表 爆 米花 机 在 
一 个 特定 时 间 段 内 发 生 族 人 障 一 二 在 蚊 攻 证 次 肖 - 所 拓 
的 社 滨 。 记 住 ， 你 发 生 和 损坏 X ~ Po(3.4) 

的 平均 次 次 是 每 周 3.4 次 ， 





1. 下 一 周 爆 米花 机 不 发 生 故 障 的 概率 是 多 少 ? 
如 景 不 发 生 故 障 ， 则 X 必 须 为 0。 






















eMr 
PX = 0) =— 
区 E> x 3.4° 
0! 
Ce 
看 来 我 们 可 以 期 望 爆 米 花 本 
机 在 下 周 只 发 生 3.4 次 故障 ， OS 


所 以 我 们 可 以 赚 险 不 买 新 爆 米 花 
机 一 可 别 告 诉 那些 看 电影 网. 





2. 下 一 周 爆 米花 机 发 生 3 次 故障 的 概率 是 多 少 ? 


区 x 3.4: 


P(X=3)= 





= 0.033 x 6.55 
= 0.216 


3. 爆 米 花 机 发 生 故 障 的 期 望 和 方差 是 多 少 ? 


E(X) = 入 var(x) = 和 \ 
= 3.4 = 
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网 ， 为 什么 用 和 代表 泊 松 分 布 的 
均值 ? 为 什么 不 像 以 前 一 样 用 4 呢 ? 


答 : 这 是 因为 泊 松 分 布 的 分 布 
和 参数、 期 望 和 方差 全 都 相等 ， 因 此 
用 入 ， 这 样 可 以 确保 公正 。 


问 : 。 泊 松 分 布 的 公式 是 怎么 来 的 ? 


答 ; 实际 上 可 以 从 其 他 公式 扒 
导出 来 ， 但 会 涉及 很 多 数学 知识 。 
在 实际 应 用 中 ， 最 好 的 做 法 是 记 住 
这 个 公式 及 其 应 用 条 件 。 


问 : 


何 差别 ? 


答 ; 主要 差别 是 泊 松 分 布 不 需 
要 做 一 系列 试验 ， 但 它 描述 了 事件 
在 特定 区 间 内 的 发 生 次 数 。 


泊 松 分 布 和 其 他 概率 分 布 有 










世上 没有 俐 问题 
阅 :必须 是 整数 吗 ? 


每 :完全 不 是 这 样 。 入 可 以 是 任 
何 非 负数 ， 但 不 能 是 负数 ， 因 为 它 
代表 一 定 区 间 内 的 事件 平均 发 生 次 
效 ， 事 件 发 生 次 数 为 负数 是 没有 意 
义 的 。 


阅 :公式 中 的 “e” 到 底 是 什么 
意思 ? 


答 :6e 是 一 个 教学 常 教 ， 即 数字 
2.718， 在 计算 泊 松 分 布 时 ， 要 在 公 
式 中 代入 常数 2.718。 


常 教 e 在 微 积分 中 应 用 频 杜 ， 广 泛 用 
于 从 计算 复 利 到 高 等 概率 理论 的 各 
种 应 用 。 对 e 的 深入 讨论 不 在 本 书 范 
围 内 。 







饮料 呢 ? 我 起 边 吃 爆 米 范 
这 喝 饮 特 , 马上 给 我 全 饮料! 


统计 邦 电影 院 又 碰 到 了 一 个 问题 。 


几 伺 分布、 二 项 分 布 及 泊 松 分 布 


阅 :我 用 泊 松 分 布 计算 概 率 的 时 
候 经 常 出 错 ， 哪 里 容易 引发 错误 ? 


签 : 有 两 个 部 分 容易 搞 错 。 
第 一 ， 一 定 要 用 对 公式 ，r 和 入 
很 容易 混 消 ， 因 此 一 定 要 确保 二 
者 正确 无 误 。 


第 二 ,一定 去 在 算式 中 正确 应 用 e* 
湄 数 ， 把 e、 留 到 最 后 再 算是 一 个 办 
法 -一 - 即 先 把 其 他 东西 算出 来 ， 最 后 
再 来 以 e*。 


不 仅 爆 米花 机 总 是 出 故障 ， 现 在， 连 饮料 机 也 开始 出 故障 了 。 饮 料 机 每 


周 的 平均 故障 次 数 是 2.3。 


下 个 星期 就 要 大 促销 了 ， 任 何 机 器 坏 了 影院 经 理 都 要 吃 不 了 兜 着 走 。 下 
个 星期 ， 爆 米花 机 和 饮料 机 都 不 出 故障 的 概率 有 多 大 ? 






饮料 机 的 概率 分 布 是 怎样 的 ? 我 们 如 何 求 出 爆 米 花 机 和 
饮料 机 在 下 个 星期 都 不 出 故障 的 概率 ? 
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Xx + y 泊 松 分 布 


概率 分 布 是 怎样 的 ? 

让 我 们 好 好 看 看 这 种 情况 。 

我 们 有 两 种 机 器 爆 米 花 机 和 饮料 机 ， 每 种 机 器 在 一 周 内 的 平均 故障 次 数 已 
经 知道 ， 求 下 一 周 机 器 不 出 故障 的 概率 。 

下 面 是 两 种 机 器 的 分 布 : 


爆 米 花 机 饮料 机 





爆 炒 花 机 每 周 发 生 故 
障 的 平均 次 数 是 3.4， 


饮 糙 机 和 急 周 发 生 故 障 


的 乎 均 次数 是 2.3， 





X ~ Po(3.4) Y ~ Po(2.3) 


如 果 X 代 表 爆 米花 机 每 周 发 生 故障 的 次 数 ，Y 代 表 人 饮料 机 每 周 发 生 故障 的 次 
数 ， 则 X 和 Y 都 符合 泊 松 分 布 ， 另 外 ，X 和 Y 是 相互 独立 的 ， 即 爆 米花 机 是 否 
发 生 故 障 对 饮料 机 发 生 故 障 的 概率 没有 影响 ， 而 饮料 机 是 否 发 生 故 障 也 对 爆 
米花 机 发 生 故 障 的 概率 没有 影响 。 


我 们 需要 求 出 下 个 星期 故障 总 次 数 为 0 的 概率 ， 即 : 


P(X+Y =0) 


-中 和 荔 动脑 


回头 复习 概率 章节 ， 如 果 X 和 YY 是 独立 变量 ， 那 么 如 何 求 X+Y 的 概率 ? 
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几何 分 布 、 二 项 分 布 及 泊 松 分 布 


组 合 泊 松 变量 
前 面 的 章节 中 讲 过 ， 如 果 X 和 Y 是 独立 随机 变量 ， 则 : 
P(X + Y) = P(X) + P(Y) 
E(X + Y) = E(X) + E(Y) 
即 如 果 X ~ Po(A,) 且 YY ~ Po(A))， 则 ; 
X+Y~ Po(A.+A) 


即 ， 如 果 X 和 Y 都 符合 泊 松 分 布 ， 则 X+Y 也 符合 泊 松 分 布 。 也 就 是 说 ， 
可 以 利用 X 和 Y 的 分 布 情况 求 出 X+Y 的 概率 。 


D> 如 果 X 是 爆 米花 机 的 故障 次 数 ，Y 是 饮料 机 的 故障 次 数 ， 则 
X~ Po(3.4), Y ~ Pol2.3)。 





1. X+Y 的 分 布 情况 如 何 ? 


2. 求 出 X+Y 的 分 布 后 ， 可 以 根据 分 布 求 出 概率 。P(X + Y = 0) 是 多 少 ? 
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_ 4 动 


hs 


1. X+Y 的 分 布 情况 如 何 ? 
入 . 十 My = 3.4 二 2.3 
三 :5 注 














义 十 丫 一 Po(5.7) 


eA\r 


后 : ”这 是 不 是 说 前 面 学 过 的 关于 
概率 和 期 望 的 简明 算法 也 适用 于 泊 松 
分 布 ? 


答 : 不 错 。 由 于 爆 米 花 机 是 否 发 
生 故 障 对 饮料 机 发 生 故 障 的 概率 没 
有 影响 ， 反 过 来 ， 饮 料 机 是 否 发 生 
故障 对 爆 米 花 机 发 生 故 障 的 概率 也 
没有 影响 ， 因 此 ，X 和 Y 都 是 独立 随 
机 变量 ， 于 是 所 有 适用 于 独立 变量 
的 简明 计算 方法 都 能 为 我 们 所 用 。 
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X~ Po(3.4), Y ~ Po(2.3)。 


2. 求 出 X+Y 的 分 布 后 ， 可 以 根据 分 布 求 出 概率 。P(X + Y = 0) 是 多 少 ? 


世上 没有 俐 问题 


X+Y 为 什么 会 


问 : 


签 :; 这 是 因为 X 和 Y 都 是 独立 变 
量 ， 且 都 符合 泊 松 分 布 。 


合 泊 松 分 布 ? 





如 果 X 是 爆 米 花 机 的 故障 次 数 ，Y 是 饮料 机 的 故障 次 数 ， 则 


下 个 星期 未 出 故障 的 几 
率 只 有 0.003? 看 来 我 
们 必须 买 新 机 器 了 ， 


| 加 : ”所 以 我 们 就 能 像 应 用 其 他 泊 
松 分 布 一 样 应 用 X+Y 的 分 布 ? 


:2 是 的 ， 我 们 可 以 用 完全 相同 


爆 米 花 机 和 饮料 机 都 会 随机 出 现 故 障 ， 的 方式 对 待 X+Y 的 分 布 ， 因 此 ， 只 


但 有 一 个 平均 故障 率 ， 这 意味 着 将 两 
种 机 器 放 在 一 起 后 ， 也 会 随机 发 生 故 
障 ， 也 会 有 一 个 平均 故障 率 ， 也 就 是 
两 种 机 器 合 起 来 仍然 符合 泊 松 分 布 的 
条 件 。 


要 知道 参数 入 ， 就 能 求 出 概率 。 


几何 分 布 、 二 项 分 布 及 泊 松 分 布 


案件 : 破碎 的 饼干 


凯特 在 统计 邦 曲 奇 饼 厂 工 作 ， 她 的 工作 是 确保 每 一 盒 饼 干 都 符合 工 
厂 严 格 的 质量 要 求 。 凯 特 知 道 每 块 饼干 发 生 破 碎 的 概率 为 0.1， 她 
的 老板 要 她 求 出 一 盒 容 量 为 100 块 饼干 的 盒子 里 出 现 15 块 碎 饼干 的 
概率 。“ 这 容易 ”， 她 说 道 ，“ 用 二 项 分 布 计算 好 了 ，n 为 100, p 
by :8 种 Gils * 
凯特 拿 出 计算 器 ， 可 当 她 计算 1001 的 时 候 ， 计 算 机 显示 出 
错 ， 因 为 数字 太 大 。“ 哦 ，” 老 板 说 ，“ 你 只 好 用 手工 方法 
计算 了 。 我 现在 可 是 要 回 家 了 ， 祝 你 晚上 愉快 。” 
凯特 瞪 着 计算 器 ， 动 起 了 脑筋 。 随 后 她 笑 了 ，“ 也 许 我 今 晚 可 以 早 
点 走 ， 到 底 还 是 有 办 法 的 。” 
不 出 1 分 钟 ， 凯 特 就 算出 了 要 求 的 概率 。 她 设法 绕 过 了 1001 的 计 
算 ， 求 出 了 概率 。 她 拿 起 外 套 走出 了 厂 门 。 


凯特 怎么 能 这 么 快 就 避 开 计算 堪 的 限制 算出 概率 ? 
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近似 泊 松 分 布 


伪装 下 的 治 松 分布 


泊 松 分 布 还 有 一 个 用 途 : 在 特定 条 件 下 可 以 用 来 近似 代替 二 项 分 布 。 









我 管 这 泌 干 歇 ? 我 为 什 
么 这 人 么 做? 






有 了 时候， 使 用 泊 松 分 布 比 使 用 二 项 分 布 更 简单 


例如 ， 假 设 需要 计算 一 个 二 项 概率 ， 其 中 mn 为 3000。 在 此 过 程 
中 需要 计算 3000! ， 就 算 有 一 个 好 计算 器 ， 这 也 很 难 计算 出 来 。 
因此 ， 懂 得 用 泊 松 分 布 正确 地 求解 近似 答案 就 显得 十 分 有 用 。 


那么 我 们 在 什么 条 件 下 能 用 这 种 近似 法 ,该 如 何 用 ? 





假设 我 们 有 一 个 变量 X， 且 X~B(n,p)， 要 求 有 这 样 一 种 条 
件 : Bltn, p) 近 似 等 于 Po( X )。 


让 我 们 首先 研究 两 种 分 布 的 期 望 和 方差 。 我 们 的 目标 是 找 出 泊 
松 分 布 的 期 望 和 方差 近似 等 于 二 项 分 布 的 期 望 和 方差 的 情况 ， 
即 希望 : 


湖 岂 -人 大 近似 np 


> np 近似 npq 
方差 一 六 A 近似 ”npq 
当 q 近 做 等 于 1 且 n 很 大 时 ，np 和 npq 近 似 相 等 。 即 : 


当 n 很 大 且 p 很 小 时 ， 可 以 用 X ~ Po(np) 近 似 代 葵 
X~B(n, p)。 


当 n 大 于 50 且 p 小 于 0.1 时 ， 为 典型 的 近似 情况 。 
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甩 何 分 布 、 二 项 分 布 及 泊 松 分 布 


一 个 学 生 要 参加 一 场 考试 ， 但 他 没有 做 任何 复习 。 他 需要 猜测 每 一 题 的 答案 ， 每 一 题 的 答对 
概率 是 0.05。 考 卷 上 共有 50 个 问题 ， 他 答对 5 题 的 概率 是 多 少 ? 用 二 项 分 布 的 泊 松 分 布 近 
似 法 求解 。 


交 : 为 什么 有 时 候 需要 用 泊 松 分 
布 近似 代 若 二 项 分 布 进行 计算 ? 


签 : 当 n 很 大 时 ,计算 "C, 比 较 因 
难 ， 有 些 计算 器 会 发 生 内 存 不 足 的 
情况， 且 太 大 的 计算 结果 会 难以 处 
理 。 使 用 泊 松 分 布 进行 近似 计算 可 
以 克服 以 上 困难 。 


世上 没有 俐 问题 
问 : 


近似 法 ? 


答 : 当 n 很 大 (比如 大 于 50)，p 很 
小 (比如 小 于 0.1)， 这 时 可 以 使 用 近 
似 法 ， 在 这 种 情况 下 ， 二 项 分 布 和 
泊 松 分 布 近似 相等 。 


那么 什么 时 候 可 以 使 用 这 种 





阅 :为 什么 把 np 作为 泊 松 分 布 的 
参数 ? 


答 ; 激 松 分 布 只 有 一 个 参数 入 ， 
且 E(X)= 入 。 这 就 是 说 ， 如 果 我 们 将 
泊 松 分 布 作 为 二 项 分 布 的 近似 ， 则 
可 以 代入 二 项 分 布 的 期 望 np。 


第 7 章 坚持 离散 317 


练习 即 推理 解答 


一 个 学 生 要 参加 一 场 考 试 ， 但 他 没有 做 任何 复习 。 他 需要 猜测 每 一 题 的 答案 ， 每 一 题 的 答对 
概率 是 0.05。 考 卷 上 共有 50 个 问题 ， 他 答对 5 题 的 概率 是 多 少 ? 用 二 项 分 布 的 泊 松 分 布 近 
似 法 求解 。 


让 我 们 用 义 表示 党 生 竹 对 的 问题 的 数目 ， 在 示例 中 ,，w=50, Pp 二 0.05，wp 二 2.5， 于 是 可 以 用 
X 一 Po(2.5) 近 似 计算 概率 。 

-人 Ar 
P(X=5)= 


r! 


区 


5! 


ez5 x 97.65625 


120 
= 6* x 0.8138 
= 0.067 





破案 : 破碎 的 饼干 

凯特 怎么 能 这 么 快 就 避 开 计算 器 溢出 错误 算出 概率 ? 
凯特 发 现 ， 尽 管 需要 用 二 项 分 布 进行 计算 ， 但 n 和 P 
的 数值 却 允 许 她 用 泊 松 分 布 对 概率 进行 近似 计算 。 

许多 计算 器 无 法 计算 大 阶乘 ， 有 时 候 这 会 令 二 项 分 
布 无 法 作为 ， 这 时 懂得 用 泊 松 分 布 进行 近似 计算 会 
大 大 节省 你 的 时 间 。 
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几何 分 布 、 二 项 分 布 及 泊 松 分 布 


有 人 要 爆 米 花 吗 ? 


本 章 内 容 已 经 接近 尾声 ， 通 过 学 习 三 种 最 重要 的 离散 概率 分 布 ， 你 
的 概率 和 统计 知识 又 长 进 了 不 少 。 你 深入 了 解 了 概率 分 布 的 作用 ， 
掌握 了 既 能 节省 时 间 、 又 能 得 出 可 靠 结果 的 简明 算法 ， 这 些 技术 将 
在 本 书后 续 章 节 发 挥 作用 。 





小 坐 一 会 儿 ， 吃 点 儿 爆 米花 吧 ， 御 劳 往 劳 自己 。 


泊 松 分 布 简明 指南 
下 面 是 有 关 泊 松 分 布 的 简明 总 结 ， 你 可 能 用 得 上 : 


何 时 使 用 泊 松 分 布 ? 


在 遇 到 独立 事件 时 (例如 机 器 在 给 定 区 间 内 发 生 故 障 )， 若 已 知 入 ( 即 给 定时 间 区 间 内 的 事件 平均 发 生 次 数 ) 且 
你 感 兴趣 的 是 一 个 特定 时 间 区 间 内 的 发 生 次 数 ， 这 时 可 使 用 泊 松 分 布 。 


如 何 计算 概 字 、 期 望 和 方差 ? 
计算 方法 如 下 : 


P(X = 口 = 二 E(X) = 入 Var(X) = 入 


如 何 对 独立 随机 变量 进行 组 合 ? 
如 果 X ~ Po( 入 ) 且 Y~ Po( 入 )， 则 : 


” 


X+Y~Po(A + 入 ) 


泊 松 分 布 与 二 项 分 布 有 何 关 系 ? 
如 果 X ~ B(n, p)， 当 n 较 大 而 p 较 小 时 ，X 可 以 近似 表示 为 : 
X ~ Po(np) 
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加 强 练习 


加 强 绒 习 


下 面 是 一 些 实例 。 你 的 任务 是 说 出 等 个 实例 符合 哪 种 概率 分 布 ， 指 出 期 望 和 方差 ， 并 求 
出 各 种 概率 。 





1. 某 人 正在 打 保 龄 球 ， 他 击 倒 所 有 球 柱 的 概率 为 0.3， 如 果 他 可 以 掷 球 10 次 ， 在 3 次 以 内 击剑 所 有 球 柱 的 概率 是 多 大 ? 





320 深入浅出 统计 学 


几何 分 布 、 二 项 分 布 及 泊 松 分 布 





2. 一 辆 公共 汽车 平均 每 15 分 钟 会 停 一 站 。 在 15 分 钟 以 内 不 出 现 公 共 汽 车 的 概率 有 多 大 ? 


3. 有 20% 的 麦片 盒 里 装 有 免费 玩具 ， 每 盒 一 个 。 打 开 不 到 4 只 麦片 盒 就 能 得 到 第 一 个 免费 玩具 的 概率 有 多 大 ? 
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加 强 练习 解答 

ee 

下 面 是 一 些 实例 。 你 的 任务 是 说 出 每 个 实例 符合 哪 种 概率 分 布 ， 指 出 期 望 各 方差， 并 求 
出 各 种 概率 。 


1. 某 人 正在 打 保 龄 球 ， 他 击 倒 所 有 球 柱 的 概率 为 0.3， 如 果 他 可 以 掷 球 10 次 ， 在 3 次 以 内 击 倒 所 有 球 柱 的 概率 是 多 大 ? 






如 果 用 X 代 表 这 个 人 击 倒 金 部 球 扶 拘 次 数 ， 则 X 一 禄 (10, 0.3)， 


E(X) = np var(X) = APa 
= 10 x 0.3 = 10x0.3x0.7 
一 2.1 


通用 概率 P(X = 站 一 "cxjrx a 


PO = 0) = "0, x 0.3° x 0.7'° 
=1x1x0.028 
= 0.028 


PAX= 71) = "0 x0.3:x0.7° 
= 10 x 0.3 x 0.04035 
= 0.121 


PO=2) = "0, 0.3 x0.7’ 
= 45 x 0.09 x 0.0576 
= 0.233 


PX<3)=PX=0) +PX=1) +PX= 2) 
= 0.028 + 0.121 + 0.233 


= 0.382 
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有 几何 分 布 、 二 项 分 布 及 深 松 分 布 


2. 一 辆 公 共 汽 车 平均 每 15 分 钟 会 停 一 站 。 在 15 分 钟 以 内 不 出 现 公 共 汽 车 的 概 府 有 多 大 ? 


娩 困 用 X 表 示 每 15 分 钟 以 内 停 训 的 公共 汽车 的 数量 ， 则 X 一 Pof1)， 


50) =A var(x) = 


一 了 =1 


Mr 
通用 机率 P(X = -一 


er x 12 





?以 一 0) 一 





3. 有 209% 的 麦片 盒 里 装 有 免费 玩具 ， 每 盒 一 个 。 打 开 不 到 4 只 麦片 盒 就 能 得 到 第 一 个 免费 玩具 的 概率 有 多 大 ? 


如 术 用 X 表 示 为 了 找 出 第 一 个 玩具 需要 打开 胎盘 片 金鹏 数目 ， 则 X 一 dieo{0.2)， 


EW) = 1/p Var(X) = a/p’ 
02 = 0.8/0.2* 
= 0.8/0.04 


= 20 
通用 要 率 PX SN) 二 1-aqr 


PHS3)=1-a 
=1-0.8’ 
二 1-0.512 
= 0.488 





第 7 章 坚持 离散 。” 323 


要 点 
上 
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要 点 


几何 分 布 的 应 用 条 件 : 进行 一 
系列 独立 试验 ， 每 一 次 试验 或 
成 功 或 失败 ， 每 一 次 试验 的 成 
功 概率 相同 ， 你 主要 想 知 道 的 
是 : 为 了 取得 第 一 次 成 功 ， 需 
要 进行 多 少 次 试验 。 


如 果 符 合 几何 分 布 的 条 件 ， 那 
么 用 X 表 示 为 了 取得 第 一 次 成 
功 需 要 试验 的 次 数 ， 用 p 代 表 
单 次 试验 的 成 功 概 率 ， 则 : 
xX ~ Geo(p) 
如 果 X ~ Gec(p)， 则 下 列 概率 
算式 成 立 : 
PR(X= 站 =pq 
P(X>7r)= qr 
PX<r)=1-q' 
如 果 X ~ Geo(p)， 则 : 
E(X) = 1ip 
Var(X) = qip? 


深入 浅 出 统计 学 


二 项 分 布 的 应 用 条 件 : 进行 一 
系列 次 数 有 限 的 独立 试验 ， 每 
一 次 试验 或 成 功 或 失败 ， 每 一 
次 试验 的 成 功 概 率 相同 ， 你 主 
要 想 知道 的 是 : 在 n 次 试验 中 
能 成 功 多 少 次 。 


如 果 符 合 二 项 分 布 的 条 件 ， 那 
么 用 X 表 示 n 次 试验 中 的 成 功 次 
数 ， 用 p 代 表单 次 试验 的 成 功 
概率 ， 则 : 


Xx ~ Bn, p) 


如 果 X ~ Bkn, p)， 则 可 通过 下 
式 计算 概率 : 


P(X=7)="C,p'q"" 
其 中 : 


nl 
i (n -ml 
”如果 X ~ B(n, p)， 则 : 
E(X) = np 
Var(X) = npq 


浪 松 分 布 的 应 用 条 件 : 单个 事 
件 在 给 定 区 间 内 随机 、 独 立地 
发 生 ， 已 知 给 定 区 间 内 的 事件 
平均 发 生 次 数 ， 或 者 叫 发 生 
率 ， 且 这 个 发 生 次 数 或 发 生 率 
是 有 限 的 ， 主 要 想 知道 的 是 : 
给 定 区 间 内 的 事件 发 生 次 数 。 


如 果 符 合 泊 松 分 布 的 条 件 ， 那 
么 用 X 表 示 给 定 区 间 内 的 事件 发 
生 次 数 ， 用 和 代表 发 生 率 ， 则 : 
X -~ Po(X) 
如 果 X ~ Po( 入)， 则 : 
全" Xr 


PD 


E(X) = 入 
Var(X) = 入 


如 果 X ~ Po( 入 xX), Y~Po(Ay), 
且 XFUY 是 独立 的 ， 则 : 


X+Y~PolX,+X,) 


如 果 X~B(n,p)， 其 中 n 足 够 
大 ，p 足 够 小 ， 则 可 将 该 分 布 近 
似 看 作 X ~ Po(np)。 


A : 
A 


和 > 


ed 





离散 概率 分 布 并 非 无 所 不 能 。 


到 目前 为 止 ， 我 们 接触 到 的 都 是 可 以 指定 确切 数值 的 概率 分 布 。 然 而 并 非 所 有 数据 
集合 都 是 如 此 ， 还 有 几 类 数据 并 不 符合 我 们 之 前 遇 到 的 概率 分 布 。 我 们 将 在 这 一 章 
里 讲解 所 谓 的 连续 型 概率 分 布 ， 并 介绍 最 重要 的 概率 分 布 类 型 之 一 一 正 态 分 布 。 
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离散 数据 与 连续 数据 


离散 数据 可 取 确 切 值 …… 


前 面 讲 到 的 概率 分 布 涉及 的 都 是 离散 数据 ， 即 数据 由 一 个 个 单独 
的 数值 组 成 ， 其 中 的 每 一 个 数值 都 有 相应 概率 。 例 如 ， 在 分 析 老 


虎 机 收益 概率 分 布 时 ， 每 一 局 赌局 可 能 出 现 的 收益 数额 是 确定 的 ， 


我 们 很 清楚 各 种 情况 的 赔 率 ， 也 知道 自己 有 机 会 赢 到 其 中 一 种 。 


如 果 是 离散 数据 ， 则 为 数值 型 数据 ， 只 能 取 确 切 值 。 离 散 数 据 往 
往 能 以 某 种 方式 进行 计数 ,例如 糖果 机 中 的 糖果 数目 ， 智 力 游戏 
中 答对 的 问题 的 数目 ， 或 是 机 器 在 一 个 特定 时 段 内 的 故障 次 数 。 


=~ ND WW a 


1 她 汪 革 局 
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但 着 非 所 有 数值 型 数据 都 是 离散 的 


一 一 列举 一 个 数据 集中 的 所 有 数值 并 不 总 是 能 够 实现 。 有 了 时候 ， 数 据 涵 
盖 的 是 一 个 范围 ， 这 个 范围 内 的 任何 一 个 数值 都 有 可 能 成 为 事件 结果 。 
例如 ， 假 定 有 人 让 你 精确 地 测量 几 段 丝线 的 长 度 ， 并 且 已 知 这 些 丝线 
的 长 度 在 10 英 寸 到 11 英 寸 之 间 ， 你 的 测量 结果 可 能 会 是 10 英 寸 、10.1 英 
寸 、10.01 英 寸 ， 等 等 ， 因 为 丝线 长 度 可 以 是 这 个 范围 内 的 任意 值 。 


这 样 的 数据 叫做 连续 数据 ， 连 续 数 据 往往 通过 测量 得 到 ， 而 不 是 和 通过 计 
数 得 到 ， 测 其 结果 在 很 大 程度 上 取决 于 测量 精度 要 求 。 


| 












可 我 为 什么 要 关心 速 续 
数据 呢 ? 


数据 类 型 会 影响 求 概率 的 方法 。 
前 面 我 们 只 讲 过 离散 数据 的 概率 分 布 ， 利 用 这 些 概 率 分 布 ， 我 们 可 以 求 出 确切 
的 离散 数值 的 概率 。 


问题 是 ， 现 实生 活 中 有 不 少 问题 所 牵涉 到 的 都 是 连续 数据 ， 离 散 概率 分 布 对 这 
类 数据 无 能 为 力 。 为 了 求解 连续 数据 的 概率 ， 你 禹 要 懂得 连续 数据 以 及 连续 概 
率 分 布 。 
同时 ， 有 人 通 到 了 一 个 问题 …… 
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频数 与 连续 数据 


推迟 几 分 钟 ? 


朱 莉 是 一 名 学 生 ， 她 最 好 的 朋友 不 停 地 安排 她 “相亲 ”， 希望 她 能 找到 
她 的 “他 ”。 唯 一 的 麻烦 是 ， 许 多 “相亲 男 ” 都 不 准时 到 场 ， 或 者 根本 
就 不 现 身 。 

朱 莉 讨厌 孤零零 地 等 待 约会 对 象 出 现 ， 于 是 她 给 自己 立 了 规矩 : 如 果 等 
过 20 分 钟 对 方 还 不 来 ， 她 就 离 场 。 















今 晚 我 还 有 另外 一 个 约会 呢 . 
我 肯定 未 会 等 20 分 钟 以 上 ， 我 讨厌 傻 等 . 
我 种 扔 在 一 边 儿 等 5 分 钟 凡 上 的 概率 是 多 
少 ? 你 能 帮忙 算 一 算 吗 ? 







统计 邦 “ 相 闲 男 ”不 准时 。， 
他 们 的 托 达 时 间 球 忽 未 定 ， 


C 


朱 首 高 开 的 时 间 . 
好 的 日 和 是 鸭 0 
注 是 朱 芽 ， 册 六 一 部， 朱 莉 抵达 ~ 20 分 钟 
2 . 拒 到 拘役 无 寺 的 时 间 . 


RP 动 动 脑 


我 们 需要 求 出 朱 莉 为 了 见 到 约会 对 象 而 等 待 的 时 间 的 概率 。 这 些 时 间 量 是 离散 的 还 
是 连续 的 ? 为 什么 ? 你 认为 我 们 该 如 何 求 出 概率 ? 
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下 面 这 张 频数 图 显示 出 朱 莉 为 了 见 到 约会 者 而 等 待 的 时 间 : 


保持 正 态 


我 们 需要 求 种 续 数 据 的 概率 分 布 


我 们 需要 求 出 这 种 情况 的 概率 : 朱 莉 为 了 见 到 约会 对 象 而 等 待 5 分 钟 以 上 。 
问题 是 ， 朱 莉 的 等 待 时 间 是 连续 数据 ， 也 就 是 说 ， 我 们 前 面 学 过 的 概率 分 
布 在 这 里 不 适用 。 


处 理 离 散 数 据 时 ， 我 们 可 以 找 出 特定 的 概率 分 布 。 为 此 ， 我 们 可 以 将 每 个 
数值 的 概率 列 于 表格 ， 也 可 以 指出 数据 符合 某 个 特定 概率 分 布 (例如 二 项 分 
布 或 泊 松 分 布 )， 通 过 这 些 做 法 ， 可 以 确定 每 一 个 可 能 数值 的 概率 。 例 如 ， 
在 我 们 求 出 肥 蛋 赌场 每 一 台 老 虎 机 的 每 局 收益 概率 分 布 后 ， 我 们 就 知道 所 


有 可 能 赢得 的 金额 ， 还 能 算出 每 一 种 车 钱 金额 的 概率 。 于 衣 雪 上 所， 各 们 能 给 


全 出 每 一 全 数值 的 概 些 。 


x _ | 4 9 1 [19 
[P(X = x) |0977 |0008 |0008 [oo06 oo0 | 


连续 数据 则 是 另 一 灵 和 情形 。 我 们 再 也 无 法 给 出 每 一 个 数值 的 概率 ， 因 为 我 们 
不 可 能 列举 每 一 个 精确 数值 。 例 如 ， 朱 莉 的 约会 者 可 能 会 在 4 分 钟 以 后 出 现 ， 
在 4 分 钟 10 秒 以 后 出 现 ， 或 在 4 分 钟 10.5 秒 以 后 出 现 ， 我 们 不 可 能 数 清楚 所 有 
的 可 能 时 间 。 相 反 ， 我 们 需要 关心 的 是 一 个 特定 精度 水 平 ， 以 及 取得 一 个 数 
值 范围 的 概率 。 











明白 了 . 对 于 高 散 概 率 今 布 来 说， 我 们 
关心 的 是 取得 一 个 特定 数值 曲 概 率 ， 而 对 于 
加 纺 概 率 分 市 杂 说 ， 我 们 关心 的 是 取 捍 一 个 
特 完 范围 的 模 率 ， 
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概率 密度 函数 


概率 密度 负数 可 用 于 描述 连续 数据 


我 们 可 以 用 概率 密度 函数 描述 连续 随机 变量 的 概率 分 布 。 


概率 密度 函数 f(x) 是 这 样 一 种 函数 : 通过 它 可 以 求 出 一 个 数据 范围 内 
的 某 个 连续 变量 的 概率 ， 它 向 我 们 指出 该 概率 分 布 的 形状 。 


下 面 是 一 张 概率 密度 函数 图 ， 示 意 了 朱 莉 为 了 见 到 约会 者 而 等 待 的 


时 间 。 
这 条 线 是 概率 密度 桓 数 ， amb 
全 着 而 等 禾 的 时 间 。 最 初 20 分 钟 ， eg 
= 清 后 下 降 为 0， 因为 这 时 人 朱 托 
kt 个 常数 ， 随后 


f(x) 





0 20 x 


看 出 来 了 吗 ? 这 个 图 形 与 频数 图 形 多 么 相符 。 这 并 非 巧 合 。 


概率 的 实质 是 告诉 我 们 事情 发 生 的 可 能 程度 ， 而 频数 告诉 我 们 
数值 出 现 的 频繁 程度 。 频 数 越 高 ， 数 值 出 现 的 概率 越 大 。 由 于 
在 最 初 20 分 钟 内 ， 朱 莉 的 等 待 时 间 的 频数 为 常数 ， 这 意味 着 概 频 
率 密度 函数 也 是 常数 。 数 









曝 ! 我 想 我 们 是 要 求 
几 个 概率 ， 说 这 些 有 
什么 用 ? 
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保持 正 态 


概率 = 面积 


连续 随机 变量 的 概率 通过 面积 表示 。 为 了 求 出 一 个 特定 数值 范围 的 概率 ， 首 先 
可 画 出 概率 密度 函数 ， 位 于 函数 图 形 下 方 上 且 介 于 这 个 特定 数值 范围 之 间 的 面积 
就 是 这 个 特定 数值 范围 的 概率 。 


例如 ， 我 们 想 求 出 朱 莉 为 了 见 到 约会 对 象 而 等 待 5 一 20 分 钟 的 概率 ， 可 以 画 出 概 
率 密度 函数 ， 再 求 出 位 于 这 个 概率 密度 函数 下 方 且 x 值 介 于 5 一 20 之 间 的 面积 。 


f(x) 





线 下 总 面积 必须 等 于 1， 因 为 总 面积 代表 总 概率 一 对 于 任何 概率 分 布 来 说 ， 总 
概率 必须 等 于 1 ， 因 此 面积 也 必须 等 于 1。 


f(x) 





A 
A 区 
ma 


ar 
es es, 





让 我 们 利用 这 张 图 求 出 朱 莉 为 了 见 到 约会 者 而 需要 等 待 5 分 钟 以 上 的 概率 。 


识 动 荔 肪 


线 下 总 面积 必须 为 1。f(x) 的 数值 是 多 少 ? ¢、 






提示 : 是 个 常数 。 
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求解 f(xX) 


匆 筑 概率 ， 先 求 f{Xx)…… 
在 为 朱 莉 算出 概率 之 前 ， 我 们 需要 求 得 f(x) ， 即 概率 密度 函数 。 


我 们 已 经 知道 fox) 是 一 个 常数 ， 也 知道 这 个 函数 下 方 的 总 面积 等 于 1。 观 察 fx) 
的 图 形 可 知 ， 图 形 下 方 是 一 个 矩形 ， 底 宽 为 20。 只 要 求 出 矩形 的 高 ， 就 可 以 
得 出 f(x) 的 数值 。 


Hx) 





矩形 的 面积 等 于 宽 乘 以 高 ， 即 : 


1=20x 高 本 
高 = 1120 
= 0.05 


这 意味 着 ftx) 必 须 等 于 0.05， 才 能 确保 线 下 面积 等 于 1。 即 : 


f(x) = 0.05 其 中 x 的 值 介 于 0 到 20 之 间 。 
图 形 如 下 ， 







并 
005, 突 
{= 0 执 20 之 同 


Z 沟 什 分 


求 出 概率 密度 函数 后 ， 就 可 以 求 PIX > 5) 了 。 
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保持 正 态 


再 求 面 积 ， 可 得 概 训 


概率 密度 线 下 方 介 于 5--20 之 间 的 区 间 是 一 个 矩形 ， 于 是 算出 矩形 面积 将 能 
得 出 概率 P(X > 5)。 


X 等 于 5 时 ,f(x) = 0.05. 


P(X > 5) = (20 - 5) x 0.05 
人 全 一 矩形 面积 = 衣 义 高 
所 以 ， 朱 莉 等 待 5 分 钟 以 上 的 概率 为 0.75。 
















匆 营 须 用 面积 囊 报 率 吗 ? 未 能 把 那 
个 范围 里 网 数值 一 个 一 个 选 出 来 .再 
把 这 些 数值 的 拖 率 加 起 来 吗 ? 以 前 高 
散 据 率 就 是 这 人 么 事 的 。 


这 种 做 法 不 适用 于 连续 概率 。 
对 于 连续 概率 ， 我 们 必须 通过 计算 概率 密度 曲线 下 方 的 面积 得 出 概率 。 


不 能 通过 把 数值 范围 内 的 每 一 个 数值 的 概率 相 加 得 出 连续 概率 分 布 的 概 
率 ， 原 因 是 数值 个 数 无 穷 无 尽 ， 因 此 求 和 计算 也 会 无 休 无 止 。 


对 于 连续 概率 分 布 的 概率 ， 唯 一 的 办 法 就 是 算出 由 连续 概率 函数 形成 的 


曲线 下 方 的 面积 。 处 理 连 续 数 据 时 ， 所 计 
算 的 是 一 个 数值 范围 的 
概率 。 
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地 上 没有 傻 问 题 


阅 ， 有 一 种 函数 叫做 概率 密度 函 
数 ， 那 么 什么 是 概率 密度 ? 


人 答 : 概率 密度 指出 各 种 范围 内 
的 概率 的 大 小 ， 通 过 概 素 密 度 浆 数 
进行 描述 。 它 与 我 们 在 第 一 章 碰 到 
过 的 频数 密度 十 分 相似 。 概 率 密度 
通过 面积 标示 概率 大 小 ， 而 频数 密 
度 通 过 面积 标示 频数 大 小 。 


问 : 


回 事 ? 


答 : 概 诗 密度 是 一 种 表示 概率 
的 方法 ， 但 它 并 非 概率 本 身 。 概 率 
密度 函数 是 图 形 中 的 一 条 线条 ， 而 
概率 则 是 这 条 线 下 方 的 一 定数 值 范 
围 内 的 面积 。 


阅 ; 我 明白 了 ,这么 说 ,如 果 
有 一 张 图 ， 图 中 画 出 了 概率 密度 函数 ， 
可 以 通过 观察 面积 求 出 概率 ， 而 不 是 
直接 从 图 上 读 出 概率 。 


答 : 完全 正确 。 对 于 连续 数据 ， 
需要 通过 计算 面积 求 出 概率 。 从 图 
上 直接 读 出 概 奉 数值 仅 适 用 于 离散 
概率 的 求解 。 


难道 概率 密度 和 概率 不 是 一 
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世上 没有 俐 问题 


阅 ; 必须 通过 计算 面积 求 要 
率 .…… 这 是 不 是 搞 复杂 了 ? 我 是 说 ， 
要 是 概率 密度 函数 是 一 条 曲线 ， 而 非 
直线 ， 那 该 怎么 办 ? 


每 : 还 是 行 得 通 ， 但 需要 用 到 
微 积 分 ， 因 此 本 书 不 打算 让 你 进行 
这 类 计算 。 问 题 的 关键 是 ， 要 明白 
概率 的 来 历 ， 以 及 如 何 理解 这 种 概 
率 。 


如 果 你 实在 对 通过 微 积分 计算 概率 
感 兴趣 ， 无 论 如 何 都 想 试 试 ， 请 大 
胆 尝试 ， 放 手 去 学 吧 。 


阅 : 关于 概率 范围 ， 你 已 经 讲 过 
不 少 。 我 如 何 求 出 一 个 精确 数值 的 
概率? 


答 : 在 处 理 连 续 数 据 的 时 候 ， 
实际 上 考虑 的 是 一 个 可 以 接受 的 精 
度 ， 并 且 基 于 这 些 数值 形成 一 个 范 
国 。 让 我 们 看 一 个 例子 : 


假定 你 想 要 一 段 毕 线 ， 长 度 10 英 寸 ， 
精确 到 英寸 。 虽 然 “你 需要 一 段 正 
好 长 10 英 寸 的 丝线 ”这 种 说 法 最 窜 
易 脱 口 而 出 ,但 这 并 不 完全 正确 。 体 
趴 正 想 要 的 是 一 段 长 度 介 于 9.5 英 寸 
到 10.5 英 寸 之 间 的 丝线 、 因 为 你 想 让 
这 段 10 英 寸 长 的 丝线 “精确 到 英寸 ”。 
即 ， 你 想 求 出 长 度 介 于 9.5 英 寸 到 10.5 
英寸 这 个 范围 内 的 和 袜 率 。 


阅 ; 如 果 我 想 求 某 一 个 精确 的 数 
值 的 概率 ， 会 是 多 少 ? 
签 : 结果 为 0 一 疾 一 听 可 能 会 


觉得 有 违 直 觉 ,但 你 的 问题 其 实 可 
以 这 样 理解 : 求 一 个 具有 无 穷 小 数 
位 数 的 精确 数 慎 的 概率 。 


让 我 们 再 以 丝线 长 度 为 例 : 如 果 你 需 
要 一 段 长 度 正 好 等 于 10 英 寸 的 丝线 ， 
会 出 现 什么 局 面 ? 一 体会 需要 用 一 
台 高 倍 放大 镜 ， 以 原子 大 小 为 精度 ， 
重出 一 段 10 英 寸 长 的 丝线 。 


“丝线 的 长 度 正好 为 10 英 寸 ” 这 个 事 


件 基本 上 不 可 能 发 生 。 也 就 是 其 概 
率 为 罕 


阅 : 但 我 确信 不 需要 那样 高 的 精 
度 。 精 确 到 百 分 之 一 英寸 就 够 了 ， 肯 
定 是 这 样 的 ， 对 吧 ? 


签 叮 ， 这 样 就 不 是 在 讨论 求 一 
个 具有 无 穷 精 度 的 数值 的 概率 ， 而 
是 回 到 10 英 寸 长 度 的 测量 精度 问题 
上 了 一 你 用 自己 选 定 的 精度 来 构 
建 可 以 接受 的 测量 范围 ， 得 以 算出 
概率 。 
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化 身 模 池 禾 度 久 煞 

一 些 禄 率 省 上 度 廓 次 找 不 到 名 们 的 裤 亩 
了 ， 你 的 任务 是 你 长 自己 龙 社 亩 省 度 
ks 







让 4 


必 标 时 可 画图 移 轨 。 


1. f(x) = 0.05， 其 中 0 < x < 20。 2. f(x) = 1, 其 中 0<x< 1。 

求 P(X < 5)。 求 P(X < 0.5)。 

3. f(x) = 1, 其 中 0 <x<1。 4. f(x) = 0.1 - 0.005x， 其 中 0 <x < 20。 
求 P(X > 2)。 求 P(X > 5)。 
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化 身 概率 密度 函数 解答 


化 身 模 地 禾 度 邹 数 解答 


一 些 模 洗 败 虎 肪 数 找 不 到 它们 的 米内 
了 ， 你 的 任务 龙 你 蒜 自 己 是 模 李 淄 度 
肪 次 ， 算 出 指定 数值 范围 内 的 禄 率 。 
必要 了 轩 可 泗 图 移 助 . 






1. f(x) = 0.05, 其 中 0 < x < 20。 2. f(x) = 1, 其 中 0 <x<1。 








3 p(X 三 5 等 于 PLS 0 P(X <0.5)=1x0.5 
Pd 这 部 分 面积 = 0.25 二 

D 20 x > x 
3. f(x) = 1， 其 中 0 < x< 1。 4. f(x) = 0.1 - 0.005x， 其 中 0 < x < 20。 
求 P(X > 2)。 We 求 P(X > 5)。 
这 个 概率 密度 耳 数 的 x 的 上 限 是 1， 当 x = 5 时 ,flx) = 0.075。 即 我 们 必须 囊 出 
即 在 大 于 上 限时 ， 结果 为 0. 高 0.075， 宽 15 的 直角 三 角形 的 面积 。 
P(X>2)=0 


f(x) 


f(x) 





XxX> 1! 则 梳 率 密度 为 0 


P(X > 5) = (0.075 x 15)/2 


1.125/2 


re 三 角 彩 的 面积 等 于 庆 
Se 来 以 高 之 积 的 1/2. 





DN 
x 
|| 
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sm ”离散 数据 由 单个 数值 组 成 。 通过 计算 一 个 数值 范围 内 的 概率 


密度 函数 下 方 的 面积 ， 可 得 出 该 
数值 范围 的 概率 。 也 就 是 说 ， 为 
了 求 出 P(a < X < b)， 必须 计算 
a 和 b 之 间 的 概率 密度 函数 下 方 的 
面积 。 


sm ”连续 数据 包含 一 个 数据 范围 ， 这 
个 范围 内 的 任何 一 个 数值 都 有 可 
能 发 生 。 其 数据 常常 用 测量 方法 
得 到 ， 而 不 是 用 计数 方法 得 到 。 


连续 概率 分 布 可 以 用 概率 密度 函 


数 进行 描述 。 概率 密度 函数 下 方 的 总 面积 必须 


等 于 1 。 


概率 算 好 了 


前 面 已 经 讲 过 如 何 使 用 概率 密度 函数 求 连续 数据 的 概率 。 我 们 算 
出 ， 朱 莉 为 了 见 到 约会 者 而 需要 等 待 5 分 钟 以 上 的 概率 是 0.75。 





将 极 了 ， 至 少 我 知道 会 
等 多 久 , 可 我 的 鞋 G 怎 
么 办 3? 








0 
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第 8 章 ” 正 态 分 布 的 运用 ”337 


身高 概率 唯一 
寻找 叶 殉 伴侣 


除了 青睐 守 时 的 男 伴 ， 朱 莉 对 于 她 这 一 类 女生 的 另 一 半 应 该 有 的 模样 也 
有 打算 










我 的 男 伴 要 在 我 穿 最 高 的 高 
眼 鞋 时 都 比 我 高 .鞋子 当 状 
是 第 一 考虑 。 





朱 莉 喜欢 穿 高 跟 鞋 ， 鞋子 越 高 她 越 开心 。 唯 一 的 问题 是 ， 她 坚持 
要 自己 的 男 伴 在 她 穿 最 高 的 高 跟 鞋 时 也 比 她 高 ， 目 前 她 身边 没有 
合适 的 人 。 

可 惜 ， 前 两 次 “相亲 ”的 男子 没有 达到 朱 莉 的 预期 。 她 想 知道 这 
些 约会 对 象 中 有 几 个 比 她 高 ， 以 及 约会 者 身高 够 得 上 她 的 标准 的 
概率 是 多 少 ? 


这 一 次 我 们 该 怎么 计算 概率 ? 
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保持 正 态 


男 侍 模型 


前 面 讲 过 十 分 简单 的 连续 概率 分 布 ， 但 那样 的 概率 分 布 无 法 体现 吸 
引 朱 莉 赶 赴约 会 的 男生 的 身高 模型 。 在 这 些 男生 中 ， 很 可 能 有 几 位 
的 身高 远 远 低 于 平均 水 平 ， 有 几 位 确实 很 高 ， 还 有 很 多 介 于 以 上 两 
种 情 闹 之 间 。 我 们 可 以 期 望 大 多 数 男生 都 具有 平均 身高 。 


} 

可 以 其 桂 出 弦 一 尝 
~ 这 六 所 高 的 男生 ， 
会 和 有 不 少男 生 鬼 身 
高 低 于 平均 值 。 


在 这 种 给 定 模式 下 ， 男 生 身 高 的 概率 密度 有 可 能 是 这 个 样子 。 


类 个 3 的 数 昌 考 少 ， 


因此 概率 密 度 拖 低 . 





vp 


高 个 3 的 孝 日 教 少 
实际 上 ， 这 种 形状 十 分 常见 ， 应 用 广泛 ， 它 叫做 正 态 分 布 。 
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正六 分 布 简介 


正 闪 分布 是 连续 数据 前 “理想 ”模型 


正 态 分 布 之 所 以 被 称 为 正 态 ， 是 因为 它 的 形态 看 起 来 合乎 理想 。 在 现实 
生活 中 ， 遇 到 测量 值 之 类 的 大 量 连续 数据 时 ， 你 “正常 情况 下 ”会 期 望 
看 到 这 种 形态 。 

正 态 分 布 具有 钟 形 曲线 ， 曲 线 对 称 ， 中 央 部 位 的 概率 密度 最 大 。 越 是 偏 
离 均 值 ， 概 率 密度 减 小 。 均 值 和 中 位 数 均 位 于 中 央 ， 具 有 最 大 概率 密度 。 


正 态 分 布 通过 参数 上 和 ?进行 定义 。 指出 曲线 的 中 央 位 置 ，c 指出 分 
散 性 。 如 果 一 个 连续 随机 变量 X 符 合 均值 为 上 、 标 准 差 为 o 的 正 态 分 布 ， 
则 通常 写作 X ~ N(E，c3)。 









具有 正常 形态 太 好 了 ， 


最 大 要 率 密 并 出 现在 均值 附近 b 在 理想 情况 下 ， 人 人 都 

因此 这 一 带 的 数 债 最 可 能 出 现 5 会 是 我 这 个 样 了 。 

/ 
X ~ N(h, o?) Pa 各 夫人 
x : 入 、 六 童 归并 钙 ，， 
a : ~ 
二 
oz 


前 面 讲 过 ， 指出 曲线 的 中 央 位 置 ，o :指出 分 散 性 。 在 实践 中 ， 这 意味 着 
o !: 越 大 ， 正 态 分 布 曲 线 越 扁 平 、 越 宽 。 
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风 果 距离 上 起 远 ， 则 概率 
密度 起 小 的 话 ， 那 么 概率 密 
度 什么 时 候 等 于 0 呢 ? 






无 论 把 图 形 画 多 大 ， 概 率 密度 永远 不 会 等 于 0 。 

概率 密度 会 越 来 越 接近 0， 但 永远 不 会 达到 0。 如 果 在 距离 十 分 通 
远 的 地 方 观察 概率 密度 曲线 ， 你 将 发 现 曲 线 就 在 0 的 上 方 掠 过 。 

还 可 以 这 样 理解 : 事件 越 来 越 不 可 能 发 生 ， 但 微小 的 发 生机 会 却 永 
远 存 在 。 





如 何 求 正 态 概 率 ? 


像 处理 其 他 连续 概率 分 布 一 样 ， 可 通过 计算 分 布 曲线 下 方 的 面积 
求 出 概率 。 曲 线 代 表 概 率 密 度 ， 概 率 则 以 特定 范围 内 的 面积 表示 。 
例如 ， 如 果 你 想 求 出 介 于 a 和 b 之 间 的 变量 X 的 概率 ， 则 需要 求 出 
曲线 下 方 介 于 a 点 与 b 点 之 间 的 面积 。 


六 影 部 分 代表 介 于 na 和 
b 之 则 的 X 的 概率 ， 





似乎 很 复杂 ? 别 担心 ， 这 比 你 想像 的 要 容易 。 

如 果 全 靠 自 己 计算 正 态 曲线 下 方 的 面积 ， 难 度 很 大 。 不 过 ， 幸 运 的 是 ， 
你 可 以 借助 概率 表 进 行 查找 。 只 要 算出 要 求 其 面积 的 范围 ， 再 在 概率 表 
中 查 相 应 概率 就 行 了 。 


保持 正 态 
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求解 概率 分 布 


正 态 概率 计算 三 步 法 
求 正 态 概率 需 分 几 个 步 又。 我 们 会 指导 你 完成 整个 过 程 ， 不 过 请 
先 看 看 下 面 这 张 导向 图 ， 形 清 方向 。 


如 时 正 臣 分 布 适 角 于 修 所 盘 到 摧 情 况 ， 
(一 则 看 看 是 台 馈 避 光合 各 插 和 
确定 分 布 与 范围 忆 有 先 得 知 这 些 信 息 ， 村 鳅 尿 
逮 需要 青 注 闲 要 琐 的 是 哪 一 部 工 
说 碍 未 朋 担 心 这 个 步 帮 ， 


MY 这 快 和 人 就 全 告 请 作息 


@ 使 其 标准 化 


避 全 全 用 方便 易 用 的 
率 表 查找 神 率 
大 功 关 成， 


@ 查找 概率 
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第 1 步 ， 确定 分 布 
我 们 要 做 的 第 一 件 事 是 确定 数据 分 布 。 


朱 莉 已 得 知 统计 邦 适龄 男生 的 身高 均值 和 标准 差 : 均值 71 英 寸 ， 方 差 20.25 
即 ， 如 果 用 X 表 示 男 生 的 身高 ， 则 X ~ N(71, 20.25)。 


这 个 简明 表示 方法 的 意思 
是 “变量 X 符 合 均值 为 71 
方 妆 为 20.25 的 正 态 分布 


hbh=71 
这 是 X 一 N(71,20.25) pi X ~ N(71, 20.25) 
的 图形， pe : 
pd - ™ 
J : yy 
az = 20.25 


我 们 还 需要 知道 哪个 数值 范围 能 得 出 正确 的 概率 面积 ,在 本 例 中 ,我们 要 求 
出 与 朱 莉 相亲 的 男生 具有 足够 身高 的 概率 。 






这 容易 。 所 莉 希 望 她 的 约会 者 比 籽 高 ， 所 以 
我 们 可 以 根据 她 的 身高 算出 概率 . 








朱 莉 身高 64 英 寸 ， 于 是 我 们 将 求 出 与 她 相亲 的 男生 比 她 高 的 概率 。 


正 态 变量 标准 化 


第 2 步 : 标准 化 为 NI0. 1) 


下 一 步 是 让 变量 X 标 准 化 ， 使 均值 为 0， 标 准 差 为 1， 据 此 得 出 标准 正 态 
变量 Z， 而 Z ~ N(0, 1)。 






你 这 是 在 闹 着 玩 吗 ? 我 为 什 
么 要 那么 做 ? 






概率 表 仅 给 出 N(0, 1) 的 概率 。 

概率 表 主 要 给 出 了 N(0，1) 分 布 的 概率 ， 因 为 不 可 能 为 每 一 条 正 态 分 布 曲线 
制定 概率 表 。k 和 o ?的 可 能 值 无 穷 无 尽 ， 当 正 态 曲 线 用 这 些 数 值 作为 参数 
表示 曲线 的 中 间 位 置 和 分 布 情况 时 ， 可 能 的 正 态 分 布 曲线 也 无 穷 无 尽 。 








~ AR=0ic2=0.2 
-~ hh=0,ac=5.0 





HR=-2,a:=0.5 


/ “ 06 
4 a 他 尼 
4d \ 和 的 可 能 数值 无穷 天 及， 
/ Ls 可 他 的 正 起 分 有 曲 瑟 也 无 江天 太 ， 


= 2 0 1 2 3 
能 够 利用 标准 正 态 分 布 意味 着 能 够 为 hh 和 o ?的 所 有 可 能 数值 使 用 同一 概率 
表 。 只 有 一 个 问题 : 如何 将 正 态 分 布 转变 为 标准 形式 ? 
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保持 芷 态 


锦 完 成 标准 化 ， 先 移动 均值 …… 


让 我 们 先进 行 正 态 分 布 转化 ， 使 得 均值 为 0， 而 不 是 71， 为 此 ， 将 曲线 
向 左 移动 71。 


= 人 向 点 移 71 b=71 











这 样 就 得 到 一 个 新 分 布 : 


X -71 ~ N(0, 20.25) 


然后 收 罕 


我 们 还 需要 调整 方差 。 为 此 ,通过 除 以 标准 差 “ 挤 窄 ” 我 们 的 分 布 。 已 
知 方差 为 20.25， 所 以 标准 差 为 45,《-_、_.. 


各 习 一 下 ， 标 准 关 是 A 
方 类 网 平方 根 ， 
X -7?1 =0 
于 是 得 到 一 一 ~ N(0, 1) 和 7 





或 Z ~ N(0, 1)， 其 中 : 
_X-71 
45 








看 着 眼熟 吗 ? 这 正 是 我 们 在 第 3 章 中 首次 讲 到 标准 差 时 出 现 过 的 og=1 
标准 分 。 通 常 ， 通 过 下 式 可 求 出 任何 正 态 变 量 X 的 标准 分 : 


X 是 我 们 试图 市 到， 


其 概率 的 灾 量 ， 


义 易 标准 及 
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求解 乙 


现在 ， 为 要 计算 其 概率 的 特定 数值 求 出 Z 


前 面 讲 过 如 何 对 概率 分 布 进行 标准 化 ， 从 而 令 X ~ N(，c3 变 为 Z ~ N(0, 1)。 
我 们 最 感 兴趣 的 是 实际 概率 ， 我 们 要 做 的 是 为 需要 求 概 率 的 数值 找 出 数值 
范围 ， 然 后 求 出 这 个 范围 的 限 值 的 标准 分 ， 最 后 可 以 通过 正 态 分 布 表 查 找 
求 得 标准 分 的 概率 。 


在 我 们 的 例子 中 ， 需 要 求 朱 莉 的 约会 对 象 比 朱 莉 高 的 概率 。 由 于 朱 莉 的 身 
高 是 64 英 寸 ， 因 此 我 们 要 求 P(X>64)， 这 个 数值 范围 的 限 值 是 64， 所 以 ,只 
要 算出 64 的 标准 分 z， 就 能 据 此 求 出 概率 。 


N(71, 20.25) 这 些 面积 相同 .但 坊 们 份 关 


以 通过 
未 知道 z 的 数值 ， 可 以 通 
= 计算 64 的 标准 分 得 出 z 值 ， 






















i Tan oy 

Tx 我 们 需要 将 这 个 图 形 。 …… 亦 为 这 个 图 一 世 
让 我 们 求 出 64 的 标准 分 。 
一 x 汪 a 
o 
64 - 71 
四 重要 统计 量 
wa mw | 

= -1.56( 保 留 两 位 小 数 ) sam- 页 | 2 







人 | 标准 分 


通过 下 式 可 书 得 一 个 数值 





所 以 ， 根据 统计 邦 男生 身高 均值 和 标准 差 ， 算得 64 的 标准 分 
为 -1.56。 


得 出 这 个 结果 后 ,我 们 就 可 以 进入 最 后 一 步 : 通过 概率 表 查 找 
概率 。 
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保持 正 态 
世上 没有 俐 问题 


阅 :这 个 标准 分 和 我 们 以 前 见 过 的 标准 分 是 一 样 的 吗 ?” 拉 :经 过 标准 化 的 数值 范围 的 概率 的 确 等 于 原来 的 分 
布 概 率 吗 ? 如 何 实现 ? 

答 ; 是 一 样 的 。 正 态 分 布 不 是 唯一 能 用 上 标准 分 

的 地 方 ， 但 是 ， 在 允许 使 用 标准 正 态 概率 表 的 情况 下 ， 和 答 ; 拔 率 相同 ， 而 且 使 用 概率 表 方便 得 多 。 


标准 分 特别 有 用 。 在 我 们 对 原来 的 正 态 分 布 进行 标准 化 时 ， 一 切 比 例 都 保 
持 相同 。 整 个 区 间 了 既 没 有 增 大 ， 也 没有 缩小 ， 由 于 代表 
概率 的 是 面积 ， 因 此 概率 也 保持 不 变 。 






标准 化 时 间 到 了 。 我 们 将 给 你 一 个 分 布 和 一 个 数值 ， 请 说 出 标准 分 。 


必 吕 缉 范 





1，N(10, 4)， 数 值 : 6 2.，N(6.3, 9)， 数 值 : 0.3 











3，N(2, 4)。 如 果 标 准 分 等 于 0.5， 数 值 是 多 少 ? 4. 数值 20 的 标准 分 是 2。 如 果 方 差 为 16， 那 么 均 
值 是 多 少 ? 
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动 动笔 解答 


沙沙 芝 
~ 解答 


1. N(10, 4)， 数 值 : 6 2. N(6.3, 9)， 数 值 : 0.3 






标准 化 时 间 到 了 。 我们 将 给 你 一 个 分 布 和 一 个 数值 ， 请 说 出 标准 分 。 





















3.N(2, 4) 。 如 果 标 准 分 等 于 0.5， 数 值 是 多 少 ? 4. 数值 20 的 标准 分 是 2。 如 果 方差 为 16， 那 么 均 


值 是 多 少 ? 






这 是 前 面 问题 网 闻 运算. 我们 已 知 标准 分 ， 需 
要 囊 原 来 的 数值 。 通 过 代入 已 知 条 件 可 求 得 X。 这 个 问题 与 问题 3 相似 。 代 入 已 知 数值 可 求 得 






XX- 









G 


20 - 上 























4 
2x4 三 20- 由 


HW 三 20-8 





0.5x2=Xx-2 





一 12 





X 三 1 十 2 
一 3 





我 们 书 出 了 概率 分 布 、 完 
成 了 标准 化 、 书 出 了 zz.。 纲 在 能 
得 出 我 的 相亲 对 象 比 我 高 鬼 概 
率 了 吗 ? 
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保持 正 态 


第 3 步 : 周 方便 易 周 的 概率 表 查 找 概 率 


既然 已 经 得 出 了 标准 分 ， 就 可 以 用 概率 表 求 概率 了 。 利 用 标准 正 态 概 光 粒 > 





率 表 可 以 查找 任何 z 值 ， 进 而 查 出 相应 概率 P(Z < z)。 我 们 已 将 需要 使 用 的 
各 种 概率 表 放 在 附录 
A ~™、 II 中 o 
/ \ 
天 \ Z~N(0,1) : 
j \ : 翻 到 658-659 页 ， 利 用 正 态 分 布 表 查找 本 
P(Z < 妈 妆 于 这 块 面 各 ， A 局 : 章 要 求 计算 的 概率 。 
AAA Ne Ee 
z 


和 如何 使 用 概率 表 ? 
先 算 z， 保 留 两 位 小 数 ， 这 就 是 你 要 在 表 中 查找 的 数值 。 


查找 概率 时 ， 需 要 用 第 一 列 和 第 一 行 找 出 数值 z， 第 一 列 为 z 值 ( 保 
留 一 位 小 数 ， 不 进行 四 舍 五 人 ) ， 第 一 行为 第 二 位 小 数 ， 两 行 的 交 
点 即 为 概率 。 


例如 ， 如 想 求 P(Z < -3.27)， 则 在 第 一 列 找到 -3.2， 在 第 一 行 找到 .07， 
然后 找 出 概率 0.005。 


这 一 行 代表 .07， 即 
> 的 第 二 位 小 数 。 


之 -2 

其 中 x 是 某 -一方 这 是 3 -2 

个 数字 和 .07 的 交点 ， 
等 于 P( 乙 < 乙 ) 









a | wo | os | ou | ms | oo | oo | oo | oo | oz | oa | 
a | oz | oo | om | oo | os | os | 00 | os | os | o0% | 
a | oe? | oo | oo | 007s | om | or | oo6 | 006 | 006s | o00 | 


第 8 章 ” 正 态 分 布 的 运用 。 “349 


使 用 概率 表 


朱 莉 要 算 的 概率 就 在 表 中 


让 我 们 回头 看 朱 莉 的 问题 ， 我 们 需要 求 P(IZ> -1.56)， 因 此 ， 让 我 们 在 概率 
表 中 查找 -1.56， 看 看 结果 如 何 。 


在 地 书 末尾 的 附录 部 分 这 是 代表 Zz 欣 第 二 
可 找到 正太 概率 表 ， 位 小 数 0.06 的 列 。 


¥ Jy 


0 


明明 明 : 


上 明 明明 明明 四 
alas ls eleslssls elelels le sls 
NA 者 


明明 明 虹 


8 
加 
8 


ol: ; 
8 
tn 


el 


这 是 代表 这 是 -1,5 和 0.06 
的 去 点 ,这 就 是 


P( 乙 二 也) 的 数值 。 


Balslsls ls ls lls ls lal lalsls sls lal 
CEES 


ZZ= -1,5x 
的 行 ， 直路 
x 是 基 个 数值 . 


| 
4 
bl 


poate 





结果 ， 在 概率 表 中 查找 -1.56， 得 出 概率 0.0594， 即 P(Z < -1.56) = 0.0594， 这 
表示 : 








P(Z > -1.56) = 1 - P(Z < -1.56) 所 过 概率 为 1 因此 曲线 下 的 总 面积 为 1。 
= 1 - 0.0594 四 


= 0.9406 





我 的 约会 对 象 
比 我 高 的 几率 有 
94%? 我 喜欢 这 
也 就 是 说 ， 朱 莉 的 约会 对 象 比 她 高 的 概率 是 0.9406。 个 结果 1 
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保持 正 态 


Wi 


通过 概率 表 可 查找 P(Z<z) 的 概率 ， 其 中 z 为 某 个 数值 。 问 题 来 了 : 芒 率 表 给 出 胸 


你 要 求 的 并 不 总 是 这 一 类 概率 ; 有 时 候 你 需要 求 一 个 大 于 z 的 连 “是 这 个 概率 . ¥ \ 
续 随 机 变量 的 概率 ,或 是 介 于 某 两 个 数值 之 间 的 一 个 连续 随机 变 







量 的 概率 。 这 时 如 何 通 过 概率 表 求 出 所 需要 的 概率 ? 


为 了 利用 概率 表 求 出 需要 的 结果 ， 需 要 好 好 动 动脑 筋 ， 通 常 的 做 
法 是 求 出 一 个 整体 面积 ,然后 减 去 不 需要 的 部 分 。 


求解 PlZ > z) 


P(Z > z) 类 型 的 概率 可 通过 以 下 方法 求解 : 人 们 忆 人 和 风 这 个 信和， 







P(Z>z)=1-P(Z<z) 










即 ， 将 Z < z 的 面积 从 总 概率 中 去 除 。 


es < /A -AAA 
LE 和 冯 | % 


求解 Pla < Z <b) 


这 一 类 概率 的 算法 略微 复杂 一 点 儿 ， 但 仍然 能 够 得 到 解答 。 可 通过 下 
列 算法 进行 计算 : 风 这 个 浆 李 可 以 
个 
Pla<Z<b)=P(Z<b)-P(Z<a) (一 的 身高 在 某 个 特 









出 朱 菊 的 约会 者 
范围 以 向 的 概率 . 







即 ， 算 出 P(Z < b)， 





然后 将 P(Z < a) 面 积 从 其 中 去 除 。 





Pa sz <b 
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世上 没有 傻 问题 


阅 ， 我 曾经 听 说 过 “高 斯 ”这 个 
术语 ， 它 指 的 是 什么 ? 


签 : 正 态 分 布 的 另 一 个 名 称 是 
高 斯 分 布 。 如 果 你 听见 别人 在 谈论 
高 斯 分 布 ， 那 么 他 们 就 是 在 谈论 正 
态 分 布 。 


阅 ;所 有 的 正 态 概率 表 都 相同 吧 ? 


答 : 所 有 的 正 态 概 率 表 都 能 给 
出 相同 的 概率 。 不 过 ， 概 率 表 的 实 
际 禾 盖 范围 会 有 一 些 变化 。 


赔 : 变化 ? 什么 意思 ? 


签 :有 的 制 表 和 考试 委员 会 为 概 
率 表 设 定 不 同 的 精度 等 级 ， 还 有 一 些 
会 以 略 有 不 同 的 格式 制作 表格 ， 人 但 表 
中 的 信息 都 是 一 样 的 。 


问 : 


么 办 ? 


如 果 我 要 参加 概率 考试 该 怎 


签 : 首先 了 解 考试 中 使 用 的 概 
率 表 的 格式 ， 然 后 看 看 能 不 能 摘 一 
份 复印 件 。 


得 到 考试 委员 会 采用 的 概率 表 后 ， 
花 点 时 间 热 悉 玖 悉 ， 这 样 你 就 能 在 考 
试 到 来 时 轻易 过 关 了 。 
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世上 没有 傻 问题 


阅 : 求 一 个 范围 的 概率 似乎 有 些 
棘手 ， 我 该 怎么 做 ? 


签 : 关键 在 于 起 办 法 通过 概率 
表 求 出 要 求 的 面积 。 氢 率 表 通常 只 
给 出 P(Z<z) 形 式 的 概率 ， 其 中 z 为 
菜 个 数值 。 因 此 ， 最 大 的 困难 就 在 
于 把 你 要 求 的 概率 改写 成 符合 这 种 
形式 的 概率 。 


如 果 所 计算 的 是 Pla < Z<b) 形 式 的 概 
率 ， 即 某 个 范围 的 概率 ， 则 需要 查 


找 两 个 概率 ， 一 个 是 P(Z < 了 j 的 概率 ， 


另 一 个 是 P(Z < b) 的 概率 ， 查 到 这 两 
个 概率 后 ， 用 了 最 大 的 概率 减 去 最 小 的 
概率 就 行 了 。 


奖 : 连续 分 布 有 众 数 吗 ? 你 能 求 
出 正太 分布 的 众 数码 ? 
签 有 。 连续 概率 分 布 的 众 数 


即 概率 密度 最 大 处 的 数值 。 如 果 画 
出 概率 密度 ， 则 众 数 为 曲线 最 高 点 
处 的 数值 。 


观察 正 态 分 布 旭 线 ， 可 以 看 到 最 高 点 
位 于 正中 央 。 正 态 分 布 的 众 数 为 凡 。 


阅 ，。 中 位 数 呢 ? 


答 : 一 个 连续 概率 分 布 的 中 位 
数 即 P(X < a) = 0.5 处 的 数值 ， 踊 将 
概率 密度 曲线 下 方 的 面积 一 分 为 二 
的 数值 。 


自 态 分 布 的 中 位 数 也 是 。 在 处 理 连 
续 娄 率 分 布 时 ， 中 位 数 和 众 数 并 不 
那么 常用 ， 期 望 和 方差 更 为 重要 。 


阅 :什么 是 标准 分 ? 


答 : 一 个 变 重 的 标准 分 即 用 这 
个 变量 减 去 其 均值 再 除 以 这 个 灾 醒 
的 标准 差 的 商 。 这 是 对 正 态 分 布 进 
行 标 准 化 的 一 和 神 方 法 ， 可 令 正 态 分 
布 转化 为 N(0,1) 分 布 ， 从 而 可 以 对 
各 种 正 态 分 布 进行 比较 。 在 处 理 正 
态 分 布 时 ， 标 准 分 很 有 有 用， 因为 这 
样 一 来 ， 体 就 可 以 通过 标准 正 态 概 
率 表 查找 概率 。 


一 个 特定 数值 的 标准 分 还 说 明了 数 
值 与 均值 相距 多 少 个 标准 着 ,你 可 
以 由 此 著 悉 该 数值 与 均值 的 相对 接 
近 程 度 。 


保持 还 恋 


必 忆 吕 蔡 


现在 该 考 考 你 的 概率 表 使 用 技术 了 ， 看 看 是 否 能 解答 以 下 概率 
问题 。 





1. P(Z < 1.42)。 


2. P(-0.15<Z< 0.5)。 


3. P(Z > z) = 0.1423。z 等 于 多 少 ? 
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动 动笔 解答 


AR 解 葵 现在 该 考 考 你 的 概率 表 使 用 技术 了 ， 看 看 是 否 能 解答 以 下 概率 


问题 。 
1.P(Z < 1.42)。 
在 概率 条 中 查 1.42 可 以 击 出 这 个 概率 ， 结 果 为 : 


P(Z < 1.42) = 0.9222 





1.42 


2. P(-0.15 < Z «< 0.5)。 
查找 P( 乙 < 0.5)， 然 后 减 去 P( 乙 < -0.15) 
PCOI15 <Z E05)= PZ <05) -PZ < -0.15) 
= 0.6915 - 0.4404 


= 0.2511 





3. P(Z > z) = 0.1423。z 等 于 多 少 ? 


这 个 问题 赂 有 难度 ， 已 知 概率 ， 要 囊 Z 值 。 
已 知 Pp( 世 > z) = 0.1423， 即 ， 


PlZ, <Z) = 1-0.1423 


= 0.8577 
接 下 来 要 事 出 哪个 = 士 网 概 率 为 0.8577， 
通过 概率 表 查 出 : 
之 一 1.07 
所 以 


P{Z, > 1.07) = 0.1423 
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保持 还 访 











等 等 ， 要 是 窑 上 我 那 双 5 
美 寸 高 网 高 眼 革 我 就 高 多 
了 ,. 这 会 不 会 影响 我 的 约会 者 
比 我 高 拘 概 率 ? 





朱 莉 有 一 个 问题 ， 当 我 们 计算 她 的 约会 对 象 比 她 个 子 高 的 概率 
时 ， 没 有 把 她 的 高 跟 鞋 算 上 。 看 看 你 能 不 能 求 出 朱 莉 穿 上 5 英寸 
高 的 高 跟 鞋 时 ， 她 的 约会 者 比 她 高 的 机 率 ? 


提醒 一 下 ， 朱 莉 身高 64 英 寸 ，X ~ N(71, 20.25)，X 为 统计 邦 
男生 的 身高 。 
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练习 解答 







朱 莉 有 一 个 问题 ， 当 我 们 计算 她 的 约会 者 比 她 个 子 高 的 概率 时 ， 没 有 把 她 的 高 跟 鞋 算 上 。 
看 看 你 能 不 能 求 出 朱 莉 穿 上 5 英寸 高 的 高 跟 鞋 时 ， 她 的 约会 者 比 她 高 的 概率 ? 






提醒 一 下 ， 朱 莉 身高 64 英 寸 ，X ~ N(71, 20.25)，X 为 统计 邦 男生 的 身高 。 







当 朱 莉 穿 上 5 英寸 高 的 高 眼 鞋 后 ， 籽 的 身高 变 为 69 英 寸 。 我们 需要 求 P(X > 69) 。 
我 们 需要 先 韦 178 风 标准 分 ， 这样 才 能 用 概率 表 查 找 相应 概率 . 







09 = 7 





45 志方 大 为 20.25， 因 此 其 平 记 
_2 很， 也 就 是 标准 吕 小 直到 
5 







= -0.44 (保留 两 位 小 数 ) 
现在 我 们 已 经 事 出 了 z， 需 要 稚 续 书 P( 乙 > z) ， 即 P( 乙 > -0.44) 。 


P( 乙 > -0.44) =1-P(Z < -0.44) 











一 1-0.3300 






= 0.67 


因此 ， 在 朱 莉 穿 上 5 英寸 高 的 高 眼 鞋 后 ， 籽 的 约会 对 象 比 煌 高 的 概率 是 0.67. 










这 样 啊 ， 我 可 以 穿 高 眼 鞋 了 ， 
他 比 我 高 的 几率 仍 站 有 67 和 3? 
妈 棒 ! 
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保持 正 态 


案件 : 缺失 的 参数 


维尔 在 芒 芒 游戏 公司 工作 ,他 过 到 了 一 个 问题 。 他 需要 向 老板 报告 
人 们 痿 过 新 游戏 第 一 关 所 花 时 间 { 分 钟 ) 的 均值 和 标准 差 。 这 倒 不 难 ， 
可 不 巧 的 是 ,一 头 恶 犬 咬 掉 了 他 写 有 概率 的 那 张 纸 。 


5 分 者 全 有 有 用 红 案 。 
AI 首先， 三 尔 知道 人们 同 过 第 一 关 所 用 的 时 间 符合 正 态 分布 。 


雁 理 全。 其次， 他 知道 一 位 玩家 的 交 关 时 间 少 于 5 分 钟 的 概率 为 
0.0045。 


最 后 ， 某 个 人 癌 过 第 一 关 花 费 的 时 间 少 于 15 分 钟 的 概率 是 0.9641。 
威 尔 如 何 求 出 均值 和 标准 差 ? 
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5 分 钟 推理 解答 


破案 : 缺失 的 参数 
威 尔 如 何 求 出 均值 和 标准 差 ? 5 分 和 宪 
威 尔 可 以 使 用 概率 表 和 标准 分 得 出 均值 和 标准 差 的 理 


表达 式 ， 然 后 求解 。 
解 管 






首先 ， 我们 知道 P(X<5)=0.0045， 从 概率 表 上 
看 ，P(X < z)， 其 中 z, = -2.61， 即 5 的 标准 分 为 -2.61。 
如 果 将 这 个 结果 代入 标准 分 公式 ， 得 到 : 








5 - 
-2.61 = 
o 
类 似 地 ，P(X < 15) = 0.9641， 即 15 的 标准 分 等 于 1.8， 我们 得 到 : 
ks 
o 
这 样 我 们 就 得 到 两 个 等 式 ， 可 以 求解 上 和 oa 。 
我 们 现在 可 以 解 
-2.6laG =5- ls 
pe = 15 到 | 这 个 方程 组 ， 


用 第 二 个 等 式 减 去 第 一 个 等 式 ， 得 : 


l.80 +2.6lo=15- -5+k 
4.41cG = 10 
o = 2.27 


将 以 上 结果 代入 第 二 个 方程 ， 得 : 


1.8 x 2.27=15- hk 
=15-4.086 
= 10.914 
即 : 


p= 10.914 这 就 是 上 和 0 网 值 . 
x < 一 
o =2.27 
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保持 正 态 


从 那 以 后 ， 他 们 部 福地 生活 在 一 起 


概率 算得 很 准 ， 朱 莉 在 上 一 次 “相亲 ”中 成 功 了 ! 为 了 保证 未 来 的 灵 
魂 伴侣 能 和 她 的 鞋子 般配 ， 朱 莉 挑 出 最 高 的 高 跟 鞋 穿 上 ， 对 他 进行 测 
试 。 还 有 ， 当 她 来 到 约会 地 点 的 时 候 ， 他 已 经 在 那儿 了 ， 她 不 用 等 呢 。 

















他 上 告诉 我 的 第 一 件 事 就 是 他 有 多 
喜欢 我 的 鞋子。 我 们 是 天 生 一 对 . 


我 们 无 法 完全 确定 季 说 
后 一 的 是 鞋子 还 是 约会 对 象 ， 
了 永 过 ， 至 少 邮 很 幸福 . 


可 事情 尚未 到 此 为 止 。 
继续 看 书 吧 ， 我 们 将 向 你 介绍 更 多 有 关 正 态 分 布 的 知识 ， 
目前 你 不 过 是 触及 皮毛 哦 。 


@ 数据 由 单个 数值 组 成 。 正 态 分 布 的 形状 为 对 称 的 钟 ”通过 在 概率 表 中 查找 标准 分 可 求 出 正 态 概 率 ， 概 率 
形 ， 其 定义 为 Nh ，a?)。 表 给 出 的 是 等 于 或 者 小 于 这 个 数值 的 概率 。 

@。 求 正 态 概率 时 ， 首 先 要 确定 所 需要 的 概率 范围 ， 然 
后 求 出 这 个 范围 的 限 值 的 标准 分 ， 算 式 如 下 : 


X-hb 
a 其 中 Z ~ N(0, 1)。 
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但 愿 所 有 的 概率 分 布 都 是 正 态 分 布 。 


有 了 正 态 分 布 ， 日 子 好 过 多 了 -一 既 能 一 口气 查 出 整个 范围 的 概率 ， 又 能 留 下 点 时 
间 玩 游戏 ， 谁 还 会 花 时 间 一 个 一 个 地 计算 概率 呢 ? 在 本 章 中 ， 你 将 学 习 如 何 闪电 般 
解决 更 复杂 的 问题 ， 还 将 懂得 如 何 将 正 态 分 布 的 便利 运用 到 其 他 概率 分 布 上 。 


进入 新 的 篇 章 ”361 


来 吧 ， 坐 上 沙 情 过 出 车 


罢 情 就 像 过 山 语 


如 今 婚礼 筹办 市 场 生 意 红火 .为 了 让 顾客 对 这 个 特别 的 日 子 刻骨 铭 心 ， 德 克 
想 出 了 一 个 好 主意 。 干 噬 一 定 要 在 地 面 上 办 婚礼 呢 ? 坐 过 山 车 不 是 更 好 吗 ? 


德 克 对 这 个 “爱情 过 山 车 ”创意 很 有 信心 ， 认 为 只 要 能 过 健康 和 安全 这 一 


Ch 


PTT 
Ch "A 






我 得 确 人 新 郎 和 新 娘 歇 综 
合体 重 示 超过 380 确 。 体 
觉得 能 帮 上 忙 吗 ? 








在 大 刀 阔 其 开展 业务 之 前 ， 德 克 需 要 确保 他 所 设想 的 特别 座驾 能 
够 承载 新 郎 和 新 媳 的 重量 ， 所 以 请 你 看 看 能 不 能 帮 个 忙 。 


他 所 设想 的 座驾 能 够 承载 最 多 380 磅 的 重量 。 新 郎 和 新 娘 综 合体 重 不 
超过 这 个 重量 的 概率 是 多 少 ? 
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超越 正 态 


双双 登 上 爱情 过 山 车 


在 开始 计算 之 前 ,我们 需要 了 解 统计 邦 新 郎 新 娘 的 体重 分 布 情况 -一 包 
括 结婚 礼服 在 内 。 新 郎 和 新 娘 的 体重 都 符合 正 态 分 布 ， 新 娘 的 体重 符合 
N(150, 400)， 新 郎 的 体重 符合 N(190, 500) ， 体 重 单位 为 “ 磅 ” 


多 新 妨 ~ N(150，400) 


新 郎 ~ N(190，500) 











190 
我 们 需要 设法 通过 这 两 个 概率 分 布 算出 一 对 新 郎 新 娘 的 体重 低 于 过 山 


车 允许 的 最 大 载荷 的 概率 。 如 果 算 出 的 概率 足够 高 ， 我 们 就 可 以 满怀 
信心 地 说 : 坐 过 山 车 举行 婚礼 的 想法 是 可 行 的 













要 是 知道 组 合 后 的 概 
率 分 布 ， 就 能 计算 这 个 概 
率 了 .那么 组 合 后 的 概率 
分 布 是 什么 样子 呢 ? 


P 再 


全 荔 急 肪 


你 觉得 我 们 该 怎样 求 出 新 郎 新 娘 综 合体 重 的 概率 分 布 ? 你 
会 是 哪 种 概率 分 布 ? 为 什么 ? 










4 /7 
见 伟 
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正 态 分 人 两 两 相 加 


正 态 新 妨 + 正 态 新 部 


让 我 们 先 任 细 看 看 新 郎 和 新 娘 的 体重 分 布 情 况 。 
如 你 所 知 ， 新 郎 和 新 娘 的 体重 符合 正 态 分 布 ， 如 下 所 示 : 


新 综 上 新 部 上 
曲 体 重 一 总 
/NN Te 
到 


六 多 数 新 经 
太 风 等 于 这 


不 过 ， 我 们 真正 要 求 的 却 是 新 郎 和 新 娘 的 综合 概率 分 布 ， 即 .要 求 新 
郎 与 新 娘 体重 之 和 的 概率 分 布 。 


新 娘 体 重 + 新 郎 体重 ~ ? 


假设 新 娘 和 新 郎 的 体重 互相 独立 ， 则 分 布 形状 应 与 下 图 有 几 分 相似 : 


处 过 ， 综 合体 重 变化 系 小 ， 
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超越 正 态 


终究 还 是 体重 问题 


还 记得 我 们 最 开始 讲 到 连续 数据 的 时 候 吗 ? 那 时 我 们 讲 过 身高 、 体 重 之 类 的 数 
据 往 往 符合 什么 分 布 来 着 ? 一 我 们 那 时 进 到 ， 身 高 、 体 重 之 类 的 数据 是 连续 数 
据 ， 且 往往 符合 正 态 分 布 。 


这 一 次 ， 我 们 研究 的 是 一 对 新 婚 佳 偶 的 综合 体重 。 综 合体 重 也 是 体重 ， 同 时 我 
们 已 经 知道 体重 的 分 布 趋势 ; 综合 体重 依然 是 连续 数据 ， 而 且 ， 综 合体 重 依然 
符合 正 态 分 布 。 这 就 是 说 ， 新 娘 加 新 郎 的 体重 符合 正 态 分 布 。 


新 娘 加 新 郎 的 综合 体重 符合 正 态 分 布 这 个 结论 对 我 们 大 有 用 处 。 这 说 明 我 们 可 
以 像 前 面 一 样 ， 利 用 概率 表 查 找 概率 ， 即 ， 我 们 可 以 查 出 综合 体重 低 于 380 磅 的 
概率 一 这 是 爱情 过 山 车 的 要 求 。 


只 有 一 个 问题 一 在 动手 查找 概率 之 前 ， 我 们 需要 知道 新 娘 新 郎 综合 体重 的 均 。 其 赂 和 新 部 的 综合 体重 
值 和 方差 。 该 怎么 求 呢 ? pe 但 雹 乌 


和 方 郑 生 多少 喉 ? 
新 娘 + 新 郎 ~ N(?, ? 










现在 考 考 你 的 记忆 力 。 还 记得 下 列 公式 的 简捷 算法 吗 ? 假定 X 
和 Y 是 独立 变量 。 


~ 蕊 芝 和 . 








1. E(X+Y) 








2. Var(X + Y) 





3. E(X - Y) 4. Var(X -Y) 
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动 动笔 解 答 


现在 考 考 你 的 记忆 力 。 还 记得 下 列 公式 的 简捷 算法 吗 ? 假定 X 
和 Y 是 独立 变 


Tt EX EY) 2. Var(X 二 YY) 
EX+Y)= E00) + E(Y) Var(X + Y) = Var(xX) 十 Var(Y) 


3 E(X=Y) 4. Var(X- Y) 
E(X -站 ) = E(X) - E(Y) ai -Y)= Var(X) + Var(Y) 














我 看 不 出 这 些 简 捷 算 法 有 
什么 好 处 ， 它 们 都 是 离散 
数据 的 公 冻 ， 而 我 们 现在 处 理 
的 是 迹 续 数据 。 





这 些 简捷 算法 也 适用 于 连续 数据 。 
我 们 最 初 讲 到 这 些 简 捷 算 法 的 时 候 ， 用 的 是 离散 数据 。 幸 运 的 是 ， 同 样 的 计算 规则 
和 简捷 算法 也 适用 于 连续 数据 。 


中 动 小 脑 


你 认为 我 们 该 怎样 用 这 些 简捷 算法 求 出 新 郎 新 娘 体重 之 和 的 概率 分 布 ? 
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综合 体重 符合 哪 种 分 布 ? 

前 面 已 经 讲 过 ， 新 郎 新 娘 的 综合 体重 符合 正 态 分 布 ， 这 说 明 我 们 可 以 利 
用 概率 表 查 找 综合 体重 低 于 某 个 特定 值 的 概率 。 

让 我 们 试 试用 X 和 Y 表 示 新 郎 新 娘 的 体重 分 布 ， 如 果 用 X 代 表 新 娘 的 体重 ， 
用 Y 代 表 新 郎 的 体重 ， 则 X 和 Y 是 独立 的 ， 然 后 需要 求 出 和 o ， 其 中 : 


义 十 站 悉 示 


也 就 是 说 ， 在 进一步 进行 计算 之 前 ， 我 们 需要 求 出 X + Y 的 期 望 和 方差 ， 怎么 求 ? 


查看 前 一 个 练习 的 答案 ， 可 以 看 出 ， 当 我 们 处 理 离散 概率 分 布 时 ， 只 要 X 和 Y 是 
独立 变量 ， 就 可 以 用 下 列 算式 计算 E(X + Y) 和 Var(X + Y): 


E(X +Y) = E(X) + E(Y) 是 Var(X +Y) = Var(X) + Var(Y) 


于 是 ， 只 要 知道 X 和 Y 的 期 望 和 方差 ， 就 能 用 上 面 的 式 子 计算 X+Y 的 期 望 和 方差 












也 就 是 说 ， 只 要 我 们 知 
道 X 和 丫 的 概率 分 布 ， 就 能 
同时 算出 X+ 丫 的 概率 分 布 ， 


我 们 可 以 用 已 知 求 未 知 。 


娘 综合 体重 的 概率 分 布 。 
让 我 们 仔细 看 看 。 


- 匠 缠 的 体重 + 新 部 的 体重 
(colt A 、 布 均值 和 方 盖 
X+Y~ N(b， C2) 训 们 由 何 获 知 它们 的 概率 分 布 均 人 0 


超越 正 态 


呢 ? 


由 于 我 们 已 知 新 娘 体重 和 新 郎 体 重 的 概率 分 布 ， 因 此 能 求 出 新 郎 新 
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深入 探讨 Xx+y 和 x-y 


Dy X + y 米 些 分 布 细 细 希 


在 研究 综合 正 态 变量 的 时 候 ， 想 办 法 求 出 X+Y 的 分 布 是 十 分 有 用 的 。。_、 记 位 ， 邮 果 两 个 亦 重 五 相对 
如 果 独 立 随机 变量 X 和 Y 符 合 正 态 分 布 ， 那 么 X+Y 也 符合 正 态 分 布 。 另 双方 的 李 弟 设 有 影响 
外 ， 你 还 可 以 使 用 X 和 Y 的 均值 和 方差 计算 X+Y 的 概率 分 布 。 症 下 长 当 十 精 站， 











为 了 求 出 X+Y 的 均值 和 方差 ， 可 以 使 用 离散 概率 分 布 的 相同 计算 公式 ， 
即 ， 如 果 : 





X~ N(k», Ox) 且 Y=~ N(ky, oy’) 


中 X 二 站 
X+Y~N(h, az 将 X 和 Y 的 均值 相 加 可 得 


差 相 加 可 得 到 X+ 丫 的 方差， 


出 果 X 和 Y 是 独立 变量 ， 
b= Hb. by * y 算法 一 这 样 日 了 就 好 
过 多 了 . 












即 ，X + Y 的 均值 等 于 X 的 均值 加 上 Y 的 均值 ，X + Y 的 方差 等 于 X 的 
方差 加 上 Y 的 方差 。 


查看 以 下 草图 ， 注 意 到 X + Y 的 方差 的 特点 了 吗 ? 





X ~ N(h ca.2?) Y~N(h cy ) X+Y~N(+bhoacz+a2) 








X + Y 的 方差 大 于 X 的 方差 .也 大 于 Y 的 方差 .这 使 得 X + Y 的 曲线 
比 X 的 曲线 和 Y 的 曲线 都 拉 得 长 ， 这 一 点 对 于 任何 正 态 X 和 Y 都 成 
立 。 在 将 两 个 变量 相 加 之 后 ， 实 际 上 增 大 了 变异 性 ， 于 是 使 得 分 布 
形状 拉 长 ; 随 着 图 形 拉 长 ， 图 形 还 会 变 得 更 扁 ， 这 样 才能 使 图 形 下 
方 的 总 面积 仍然 为 1。 
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x 一 y 梳 替 分 布 细 细 项 
有 时 候 ，X + Y 并 不 是 你 要 求 的 概率 ， 如 果 所 求 的 是 两 个 变量 之 差 的 
概率 ， 则 需要 计算 X-Y。 


如 果 X 和 Y 是 独立 随机 变量 ， 且 都 符合 正 态 分 布 ， 则 X - 立 符合 正 态 分 
布 ， 这 一 点 和 X + Y 的 规律 完全 一 样 。 


为 了 求 出 均值 和 方差 ， 我 们 再 次 使 用 离散 概率 分 布 的 同一 组 简捷 算 
法 ， 只 要 : 
















X~ Nh, oY ~ Np,, o,’) 






用 加 法 和 计算， 这 和 离散 
X-Y~ N(b， 0”) 放生 各 遍 扩 计划 一 村 一 樟 ， 







= 2 王 2 2 
b=-h, ， oz=oz+a 










即 ，X-Y 的 均值 等 于 X 的 均值 减 去 Y 的 均值 。 X- YY 的 方差 等 于 X 的 均值 刀 减 ， 


方差 加 上 Y 的 方差 。 Fo 


X~ N(h,, 9 7) Y=~ N(h,, g,”) m= X-Y ~ N(b.-hy o2+ 0,2) 


nh 


看 这 图 形 风 形状 和 x + 
方差 的 加 法 计算 一 眼看 上 去 并 不 直观 ， 不过， 这 和 计算 离散 概率 分 布 ”的 形 状 一 样 这 是 因 思 证 


的 道理 是 一 样 的 ， 尽 管 我 们 用 X 减 去 Y， 但 实际 上 变异 性 还 是 增 大 了 ， 本， 组 曲线 的 中 心 个 
方差 之 和 反映 了 这 种 变化 。 和 X+Y 的 分 布 一 样 ， 无 论 是 与 x 相 比 还 是 二 
与 Y 相 比 ，X-Y 都 导致 图 形 拉 长 、 变 遍 。 


查看 X - Y 的 形状 ,可 以 看 出 该 曲线 形状 和 X+Y 的 曲线 形状 一 样 ， 
只 不 过 中 心 位 置 发 生 了 移动 。 两 种 概率 分 布 的 方差 相同 ， 均 值 各 异 。 























第 9 章 再 谈 正 态 分 布 的 运用 369 


x + y 的 概率 计算 


求 灵 概率 


既然 知道 如 何 计算 X + 《的 概率 分 布 ， 就 让 我 们 看 看 如 何 利用 


这 个 概率 分 布 计 算 概率 。 步 又 如 下 : 


@ 算出 分 布 和 范围 


名 们 知道 


-i 训 自 让 办 法 站 出 均值 和 方 基 ， 


~ 


各 首 分 市 和 范围 辣 ， >》 好 将 分 布 标准 化 


即 可 进行 标准 化. 


网 :告诉 我 ， 为 什么 我 们 需要 求 
X +Y 的 分 布 ? 


签 : 我 们 所 求 的 是 新 郎 新 娘 综 
合体 重 低 于 380 矿 的 概率 ， 即 需要 
知道 综合 体重 的 分 布 情况 。 我 们 用 
X 代 表 新 娘 的 体重 ， 用 Y 代 表 新 最 的 
体重 ， 因 此 需要 求 X + Y 的 分 布 。 


阅 :你 说 我 们 可 以 用 概率 表 坦 
X + Y 的 概率 。 怎 么 做 呢 ? 


签 : 和 以 前 的 做 法 一 模 一样 : 
找 出 概率 分 布 ， 算 出 标准 分 ， 然 后 
在 概率 表 中 查找 。 
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ANNA 


合 查找 概率 


，。 我 们 党 要 利 果 X 十 站 


六 后 可 在 标准 正 态 福 


感觉 似 曾 相 似 ? 这些 步 最 和 上 一 章 中 的 正 态 分 布 的 
计算 步骤 是 一 模 一 样 的 。 


世上 没有 有 俐 问题 


查找 X+Y 的 概率 和 查找 别 的 变量 的 概 
率 并 无 区 别 ， 只 要 求 出 标准 分 ， 即 可 
查找 出 所 求 概率 。 


阅 :这 么 说 ,我们 用 来 计算 离散 
数据 的 简捷 算法 同样 适用 于 连续 数据 ? 


答 :不 钳 ， 是 这 样 。 这 样 就 可 以 
方便 地 将 随机 变量 综合 起 来 ， 求 出 其 
分 布 方 式 ， 进 而 解答 更 复杂 的 问题 。 


关键 要 记 住 ， 只 有 在 变量 为 独立 变 
重 时 ， 这 些 简捷 算法 才 进 用 。 


届 :能 告诉 我 “独立 ”是 什么 意 
思 吗 ? 


答 : 如果 两 个 变 重 互 为 独立 变 
量 ， 则 它们 相互 之 阅 对 对 方 的 概 素 
没有 影响 。 在 我 们 所 举 的 例子 中 ， 
我 们 假定 新 嫌 的 体重 不 受 新 岂 的 体 
重 的 影响 。 


阅 :如果 x 和 vY 不 独立 呢 ? 情况 会 
如 何 ? 


答 : 如 果 X 和 Y 不 独立 ， 则 我 们 
无 法 使 用 这 些 简 捷 算 法 ， 而 需要 大 
动 干 苞 地 求 出 X+Y 的 分 布 ， 这 样 才 
能 得 出 X 和 Y 之 间 的 关系 。 


超越 正 态 


通过 下 列 3 个 步骤 求 出 新 娘 和 新 部 的 综合 体现 少 于 380 磅 的 概率 。 


必 忆 咏 昔 


1. X 为 新 娘 体重 ，Y 为 新 郎 体重 ， 且 X ~ N(150, 400)，Y ~ N(190, 500)。 根 据 以 上 信息 ， 求 出 新 郎 新 娘 综合 
体重 的 概率 分 布 。 


2. 然后 ， 利 用 所 求 出 的 概率 分 布 ， 计 算 380 磅 的 标准 分 。 


3. 最 后 ， 利 用 标准 分 查 出 P(X + Y < 380)。 
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动 


六 功 苞 


家 解 管 通过 下 列 3 个 步骤 求 出 新 娘 和 新 郎 的 综合 体重 少 于 380 磅 的 概率 。 


1. X 为 新 娘 体重 ，Y 为 新 郎 体重 ， 且 X ~ N(150, 400),Y ~ N(190, 500)。 根 据 以 上 信息 ， 求 出 新 郎 新 娘 综 合 
体重 的 概率 分 布 。 


我 们 需要 事 X+ 丫 的 报 府 分 市 ， 为 了 形 出 X+ 丫 的 均值 和 方 老 ， 我 们 将 X 和 丫 各 外 的 声 亿 和 方 郑 加 起 来 ， 
得 到 ， 


X+¥~N(340, 900) 


2. 然后 ， 利 用 所 求 出 的 概率 分 布 ， 计 算 380 磅 的 标准 分 。 





- X- 
Ca Te 示 记 得 我 们 以前 用 过 赐 工 = 一 吗 ? 
380 - 340 
0 这 一 决 ， 我 们 用 的 是 XX 十 丫 的 所 率 分 布 ， 
= t+- 


- bz 


三 1.33 (保留 两 位 小 数 ) 


3. 最 后 ， 利 用 标准 分 查 出 P(X + Y < 380)。 


吉 果 我 们 在 标准 正 态 概 率 表 中 查找 1.33， 得 到 机率 0.9082， 即 ， 


PX + < 380) = 0.9082 
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超越 正 态 


加 朱 莉 的 媒人 又 忙 开 了 。 一 名 男子 至 少 比 一 名 女子 高 5 英寸 的 概率 是 多 少 ? 


红 习 在 统计 邦 ， 身 高 以 英寸 计量 ， 男 性 身高 的 概率 分 布 为 N(71,20.25)， 女 性 身高 的 概率 分 布 
为 N(64,16)。 
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练习 解答 


A 人 朱 莉 的 媒人 又 忙 开 了 。 一 名 男子 至 少 比 一 名 女子 高 5 英寸 的 概率 是 多 少 ? 
鹤 习 


所 在 统计 邦 ， 身 高 以 英寸 计量 ， 男 性 身 离 的 概率 分 布 为 N(71,20.25)， 女 性 身高 的 概率 分 布 为 
N(64,16)。 





让 我 们 用 X 代 囊 男 性 身高 ， 用 丫 代表 女性 身高 ， 即 : X 一 N{71, 20.25) ,站 ~ N(64, 16) 。 
我 们 需要 书 出 一 名 男子 比 一 名 女子 至 少 高 5 英寸 蚂 概 率 ， 即 需要 求 ， 

PX>Yt5) 
或 

PX-Y>5) 


为 了 未 出 X- 丫 拘 声 信和 方 邓 ， 我 们 用 X 的 均值 减 去 丫 拘 均 值得 到 ， 


X - 丫 一 N(7, 36.25) 


我 们 需要 囊 出 5 英寸 的 标准 分 ， 
2 


So 
5-7 


6.02 





一 -0.3 了 3 (你 留 购 们 小数 ) 


于 是 可 以 事 出 PC - 丫 > 5). 
PX-Y>5)=1-PX-Y<5) 
= 1-0.3707 


= 0.6293 
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超越 正 态 


更 多 人 想 坐 爱情 过 山 车 


看 来 ,新郎 新 娘 的 综合 体重 小 于 过 山 车 限额 载荷 的 几率 很 大 ， 不 过 ， 
为 什么 仅 限 新 郎 新 娘 乘坐 过 山 车 呢 ? 






客户 们 要 求 让 更 多 星 礼 宾客 你 上 过 山 
车 ,他们 三 意 出 大 价钱 ,这 太 将 了， 
未 过 ， 眉 情 这 山 车 承受 得 了 这 些 题 外 
的 负载 吗 ? 








让 我 们 再 加 上 一 辆 轿车 ， 另 外 载 上 四 位 婚礼 成 员 ， 看 看 结果 如 何 。 这 
些 成 员 可 能 会 是 老 爸 、 老 妈 、 伴 娘 、 伴 郎 或 新 娘 新 郎 希 望 共同 登 车 的 
任何 人 。 


轿车 的 总 载重 量 为 800 磅 ， 假 定 一 位 成 年 人 的 体重 分 布 为 : 


X~ N(180, 625) 


其 中 Xx 代表 一 位 成 年 人 的 体重 ， 单 位 为 “ 磅 ”。 可 是 如 何 计算 4 位 成 年 
人 的 综合 体重 低 于 800 磁 的 概率 呢 ? 


信 动 泌 脑 
回头 想 想 计算 期 望 和 方差 时 用 过 的 简捷 算法 ， 独 立 观 察 结 果 和 线性 变换 之 间 有 何 差 
别 ? 二 者 分 别 对 期 望 和 方差 有 何 影响 ? 哪 一 种 算法 更 适合 解决 这 里 的 问题 ? 
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线性 变换 与 独立 观察 结果 


线性 变换 描述 了 数据 的 基本 变化 …… 
让 我 们 先 看 4X 的 概率 分 布 ， 其 中 X 为 一 位 成 年 人 的 体重 。4X 是 否 适 合 描 
述 4 位 成 年 人 的 概率 分 布 ? 


4X 的 分 布 其 实 是 X 的 一 个 线性 变换 ， 是 X 进 行 aX +b 变换 的 结果 ， 其 中 a 
等 于 4，b 等 于 0， 这 与 我 们 先前 在 离散 概率 分 布 中 遇 到 过 的 变换 类 型 完全 
相同 ， 、 抵 这 分 布 持 述 的 是 一 


\“ 芯 年 人 的 体重 放 # 


线性 变换 描述 的 是 概率 分 布 中 的 数值 在 大 小 方面 的 基本 变化 ， 即 ，4X 其 丰 和 体重 和 家 了 ， 


售后 


实 描述 的 是 一 个 成 年 人 的 体重 放大 四 售后 的 结果 。 属 避 年 人 的 数目 不 朗 。 





么 线性 变换 的 分 布 是 怎样 的 ? po 


假定 你 有 一 个 X 的 线性 变换 ， 其 形式 为 aX+b， 其 中 X ~ N(k,o”))， 由 于 X 符 合 
正 态 分 布 ， 于 是 aX + b 也 属于 正 态 分 布 。 但 期 望 和 方差 是 多 少 呢 ? 


让 我 们 先 算 期 望 。 在 讲 离散 概率 分 布 的 时 候 ， 我 们 发 现 E(aX + b) = aE(X) + b 
现在 ，X 符 合 正 态 分 布 且 E(X) = pj ， 于 是 我 们 得 出 E(aX + b) = an +b 


方差 的 处 理 方法 与 此 相似 ， 在 讲 离散 概率 分 布 的 时 候 。 我 们 发 现 Var(aX + b) = 
az Var(X)， 且 这 里 的 Var(X) = G:， 于 是 得 出 Var(aX + b) = a?o?。 


合并 以 上 两 个 结果 ， 得 到 : 2 新 方 


aX+b~ Nah+b，a2c2) 


闫 是 0 纳 平 方 与 原 方 其 差 的 系 积 。 


即 ， 新 均值 为 ak + b， 新 方差 为 22?+o*。 那 么 独立 观察 结果 是 多 少 ? 
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而 独立 观察 结果 描述 的 是 你 有 多 少数 值 
我 们 实际 需要 计算 的 是 4 位 独立 成 年 人 的 综合 体重 的 概率 分 布 ， 而 不 是 对 
每 一 位 成 年 人 的 体重 进行 变换 。 即 ， 我 们 需要 算出 X 的 4 个 独立 观察 结果 
的 概率 。 





每 一 位 成 年 人 的 体重 都 是 X 的 一 个 观察 结果 ， 这 意味 着 每 一 位 成 年 人 的 
体重 都 通过 X 的 概率 分 布 进行 描述 。 我 们 需要 算出 X 的 4 个 独立 观察 结果 
的 概率 分 布 ， 也 就 是 要 求 以 下 概率 : 


站 


其 中 X,、X,、X, 和 X, 是 X 的 独立 观察 结果 
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求 期 望 和 方差 


独立 观察 结果 的 期 望 和 方 营 


在 讲 到 离散 随机 变量 的 独立 观察 结果 的 方差 和 期 望 时 ， 我 们 曾经 发 现 : 


E(X, + X, + … X,) = nE(X) 


Var(X + X + :+ X) = nVar(X) 


如 你 所 料 ， 相 同 的 算法 也 适用 于 连续 随机 变量 ， 即 ， 如 果 X ~ N(p,o”)， 则 ; 


X + X, + +X ~ N(ny, nc2) 


世上 没有 俐 问题 


阅 :线性 变换 和 独立 观察 结果 之 
间 有 何 差别 ? 


答 ;， 线性 变换 彩 响 概率 分 布 中 的 
基本 数值 。 例 如 。 如 果 你 有 一 根 特定 
长 度 的 绳子 ， 那 么 ， 进 行 线性 变换 会 
影响 绳子 的 长 度 。 


独立 观察 阁 果 影 响 所 处 理 的 事件 的 数 
景 。 例 如 ， 如 果 一 段 绳子 有 n 个 独立 
观察 结果 ， 则 所 讨论 的 就 是 n 段 绳子 。 


通常 ， 如 果 数 量 发 生变 化 ， 则 所 面 对 
的 是 独立 变量 ; 如 果 基 本 数据 发 生变 
化 ， 则 所 面 对 的 是 变换 。 
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问 : nones ee 总 


这 有 什么 区 别 ? 





@ 如 果 X~ NI(h，o2) ， 
Y~N(p,, ao2)， 且 X 和 Y 
为 独立 变量 ， 则 





签 : 你 必须 分 清楚 哪 是 哪 ， 因 
为 这 会 影响 概率 计算 。 对 于 线性 变 
换 和 独立 观察 结果 ， 均 值 的 计算 方 
法 是 相同 的 ， 但 方差 的 计算 方法 有 
很 大 差别 。 如 果 存 在 ni 个 独立 观察 结 
果 ， 则 新 方差 是 原 方差 的 n 售 。 如 果 
将 概率 分 布 按照 aX + b 的 形式 进行 线 
性 变换 ， 则 新 方 盖 为 原 方差 的 az 售 。 






X+Y~N(p,+ by 如 二 52 
X-Y~Nb,- hy at oa 







如 果 X ~ Nu ，c3 且 a 和 b 
都 是 数字 ， 则 : 







axXx+b~Nau +b,a:o?) 


问 : ”我 能 在 同一 个 概率 分 布 中 既 
拥有 独立 观察 结果 又 拥有 线性 变换 吗 ? 


答 : 可 以 。 在 计算 概率 分 布 的 时 
候 ， 只 要 退守 方差 和 期 望 的 基本 计 
算 规律 即 可 。 离 散 报 率 分 布 和 连续 
概率 分 布 的 规律 是 相同 的 。 


如 果 X, X,，…, X 为 X 的 独立 
观察 结果 ， 且 X~ Nu， o2), 
则 : 







X + + + XX ~ NNp,no?) 





超越 正六 


让 我 们 为 德 克 解答 爱情 过 山 车 问题 。4 个 成 年 人 的 综合 体重 小 于 800 磅 的 概率 是 多 少 ? 假定 
链 习 每 个 成 年 人 的 体重 分 布 都 符合 N(180, 625)。 
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练习 解答 


让 我 们 为 德 克 解答 爱情 过 山 车 问题 。4 个 成 年 人 的 综合 体重 小 于 800 磅 的 概率 是 多 少 ? 假定 
姻 习 每 个 成 年 人 的 体重 分 布 都 符合 N(180, 625)。 


解答 


芭 巡 我 们 用 X 表 示 一 个 成 年 人 网 体重 ， 则 XX 一 N(180, 625)。 我们 需要 上 先 求 出 4 个 成 年 人 的 体重 的 
分布 情况 。 为 了 囊 出 这 个 新 分 布 的 均值 和 方 郑 ， 我 们 将 X 的 均值 和 方 郑 乘 以 +。 于 是 得 出 : 


Xx, 十 X, + X, + X, ~ N{720, 2500) 


芍 了 事 忠 P(X, 十 X, + X 十 Xe< 800)， 我 们 移民 标准 今 : 


XxX~ hu 


让 标准 正 态 挤 率 表 中 查看 这 个 数 馆 ， 得 到 0.9452， 即 ， 


POX, + xX, + X, + X,< 800) = 0.9452 





380 深入 浅 出 统计 学 


swival 


mh 
4 






大 家 好 ， 欢 迎 再 次 观看 统计 邦 热门 暂 力 节 
目 “ 赢 赢 赢 ”， 今 晚 的 节目 更 精 肝 
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我 们 沪 天 为 你 准备 了 更 多 搞怪 难题 ， 让 我 们 继续 
加 油 。 在 这 一 轮 节 目 中 ， 我 打算 问 你 40 个 问题 ， 你 需 
要 答对 30 题 以 上 才能 进入 于 一 轮 出 赛 ， 要 未 就 领 了 鼓 
励 奖 元 场 ， 乱 一 个 问题 有 四 个 备 选 答案 .这 一 轮 的 标 
题 是 “ 懂 我 您 发 多 一 些 ”。 祝 你 将 运 ! 


以 下 是 第 三 轮 比赛 的 前 5 题 ， 都 是 关于 节目 主持 人 的 。 





382 ”深入 浅 出 统计 学 


超越 正 态 


接着 玩 ， 还 是 转身 走 ? 


和 以 前 一 样 ， 你 不 可 能 这 么 了 解 节目 主持 人 ， 以 至 于 能 够 答对 有 关 他 
的 所 有 问题 ， 看 来 你 又 要 随机 回答 问题 了 。 


那么 ， 在 40 个 问题 中 答对 30 个 问题 以 上 的 概率 是 多 少 呢 ? 我 们 将 根据 
这 个 概率 决定 是 去 还 是 留 。 


~\ 亏 蕊 区 






你 该 怎样 求 出 在 40 个 问题 中 至 少 答对 30 个 问题 的 概率 ? 要 经 过 
哪些 步骤 才能 得 出 正确 答案 ? 如 何 求 均值 和 方差 ? 





我 们 并 不 要 求 你 算出 概率 ， 你 只 要 说 出 求解 步骤 就 行 了 。 


第 9 章 再 谈 正 态 分 布 的 运用 “383 















你 该 怎样 求 出 在 40 个 问题 中 至 少 答对 30 个 问题 的 概率 ”要 经 过 
哪些 步骤 才能 得 出 正确 答案 ”如 何 求 均值 和 方差 ? 


我 们 并 不 要 求 你 算出 概率 ， 你 只 要 说 出 求解 步骤 就 行 了 。 


\、 动 动荡 
AS 解答 





共有 40 道 题目， 也 就 是 说 共有 40 颖 诺 答 机 会 ， 得 一 决 斌 答 惑 是 答对 ， 或 是 答 错 ， 而 且 ， 我 们 把 吉 出 答对 一 
完 数 量 拘 题目 拘 皂 率 ， 为 此 需要 使 用 二 项 分 布 。 仿 =40， 由 于 每 个 问题 都 有 4 个 候选 答案 ， 所 以 为 1[4 ， 
即 0.25。 


必 果 X 为 我 们 答对 的 题 数 ， 则 我 们 要 求 拘 是 P(X>30)， 即 我 们 必须 将 P(X=30) 直 至 P(X=40) 胸 概率 算出 来 ， 
再 加 总 


我 们 可 以 用 wp 和 9 算出 雹 什 和 方 葵 ,其 中 qq = 二 1-P, 均 信 等 于 wp， 方 匡 等 于 wpq， 于 是 得 出 场 慎 = 40 x 0.25 


二 10, 方 此 一 40x0.25x0.75 一 7.5，. 








可 要 把 这 此 计算 统统 做 完 
也 太 折 旭 人 了 了 了， 有 了 设 有 更 
简单 的 办 法 ? 


使 用 二 项 分 布 会 带 来 蒙 重 的 工作 。 


为 了 求 出 答对 30 题 以 上 的 概率 ， 我 们 需要 把 11 个 单独 算得 的 概率 加 
起 来 一 其 中 的 每 一 个 概率 都 来 之 不 易 ， 计 算 过 程 中 极 易 出 错 。 


我 们 需要 找到 一 个 更 简便 的 算法 计算 二 项 分 布 。 
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超越 正 坊 


要 是 别 拘 分 布 也 像 正 态 分 布 一 样 容易 计 
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正 访 分 布 出 手相 救 


我 们 已 经 看 出 ， 二 项 分 布 会 让 我 们 的 日 子 不 好 过 ， 计 算 繁复 艰深 且 容 易 出 
错 ， 时 间 哗 啦 啦 流 逝 ， 换 来 的 却 是 错误 的 答案 。 

似乎 绝望 了 ? 别 担心 ， 还 是 有 容易 的 办 法 的 。 

在 某 些 情况 下 ， 可 以 用 正 态 分 布 近似 代 埠 二 项 分 布 。 










你 是 说 可 以 用 正 态 分 
市 近似 代替 二 项 分 布 ? ! 

我 还 以 为 要 用 访 松 今 市 呢 . 
这 是 什么 原因 ? 












在 某 些 情况 下 ， 泊 松 分 布 可 以 近似 代 着 二 项 分 布 ， 不 过 ， 在 另 一 些 情 况 
下 ， 正 态 分 布 也 可 以 近似 代 普 二 项 分 布 。 


懂得 用 其 他 分 布 近似 代 蔡 二 项 分 布 十 分 有 用 ， 它 能 化 繁 为 简 。 在 某 些 情况 下 ， 
泊 松 分 布 可 以 帮助 我 们 计算 一 些 繁杂 难 解 的 概率 。 


在 另 一 些 情 况 下 ， 则 可 以 利用 正 态 分 布 近似 代 荐 二 项 分 布 。 这 样 做 好 处 极 大 ， 
我 们 可 以 用 正 态 概 率 表 方便 地 查找 需要 求解 的 概率 ， 从 而 免 去 种 种 计算 。 


我 们 只 需 和 弄 清楚 在 哪些 情况 下 适合 进行 这 种 替代 就 行 了 。 


我 们 在 此 前 一 段 时 间 讲 过 如 何 使 用 泊 松 分 布 近似 代替 二 项 分 布 ， 在 哪 
种 情况 下 适合 进行 这 种 代替 ? 





“ 虹 和 站 些 字 妖 三 央 闪 项 计 色 过) 有 时 “机 10> dd 本 os <v 生 
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超越 正 态 


化 身分 布 


其 下 是 一 些 二 项 分 布 ，n 和 p 煞 值 各 异 。 
你 的 任务 是 你 装 自 己 是 其 中 的 分 布 ， 
人 ~» 并 说 出 嘟 一 个 分 布 最 这 合用 正和 洗 分 布 
证 上。 地 行 过 似 代 铬 。 仔细 现 昌 每 
分 布 的 形状 ， 说 说 嘟 一 个 图 形 
Ne 奖 符 侣 正 符 . 


二 ， 














01234567 8 9101112131415161718192C 
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化 身分 布 
其 下 是 一 些 二 项 分 布 ，n 和 p 数 值 台 异 。 


。 你 的 任务 是 你 芍 自 己 是 其 中 的 分 布 ， 
3 并 说 出 另 一 个 分 布 最 这 合用 正和 革 分 页 






进行 近似 伐 着。 仔细 观 湖 每 种 
分 布 的 形状 ， 说 说 嘟 一 个 图 形 
总 得 合 正和 沪 ， 


但 很 难 取 出 一 自生 
清 的 名 移 则 我 ， 风 正 态 分布 这 人 必 、 
这 个 分 布 不 可 能 县 有 是 够 的 正 


n=5 
p=0.5 


这 人 分布 很 对 种 ， 










0 | 2 3 4 5 


在 这 几 种 分 布 中 ， 这 个 分 布 最 适合 用 正 态 分 布 近 似 代替 ， 当 
w= 二 20 且 P= 二 0.5 时 ， 分 布 形状 与 正 态 分 布 鬼 形 状 最 入 相似 . 








0.3 
n=20 


p=0.5 





0.2 


0.1 





8 9 10 012345678 91011121314151617181920- 
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何 时 间 正 态 分 布 近 似 人 代替 二 项 分 布 

在 某 些 情况 下 ， 二 项 分 布 的 形状 看 上 去 和 正 态 分 布 的 形状 十 分 相似 ， 在 这 样 
的 情况 下 ， 我 们 可 以 用 正 态 分 布 代替 二 项 分 布 ， 得 出 与 二 项 分 布 的 概率 极其 
近似 的 结果 。 我 们 可 以 不 再 大 量 计 算 单 个 概率 ， 而 是 在 标准 概率 表 中 查找 整 
个 落 上 率 。 

个 范围 的 概率 是 次 数 ，? 征 茂 功 
那么 在 哪些 情况 下 可 以 这 么 做 呢 ? 涛 亩 ，A 竺 于 1 全。 
在 上 一 个 练习 中 我 们 看 到 ， 当 p 在 0.5 左 右 、n 在 20 左 右 时 ， 二 项 分 布 的 外 形 与 

正 态 分 布 的 外 形 十 分 相似 ， 一 般 说 来 ， 当 np 和 nq 双双 大 于 5 时 ， 可 以 用 正 态 

分 布 近似 代替 二 项 分 布 。 


求解 均值 和 方差 


为 了 能 用 正 态 概率 表 查 找 概率 ， 我 们 需要 知道 均值 和 方差 ， 以 便 算 出 标准 差 。 均 值 和 方差 可 
以 直接 从 二 项 分 布 得 出 ,在 最 初 讲 到 二 项 分 布 时 ， 我 们 发 现 : 


凡 = np 且 o =npq 


我 们 可 以 把 以 上 数值 作为 正 态 分 布 的 参数 : FE 芒 分 布 
2 当 wp 和 wa 弘 双 类 于 5 时 ， 本 广 肌 正念 
由 似 计 算 二 项 分 布 的 概率 ， 这 衬 的 "人 
、 值 和 aq 值 会 为 我 人 
六 分 布 换 关 观 、 平 请 的 形状 ， 











1 显现 一 个 十 分 接近 王 











npq OV 
某 些 课本 的 近似 
> 
“i 重要 统计 量 条 件 为 np > 10 
| 小 必 ) 及 nq>10。 
< Am AAS : 
| 二 项 分 布 的 近 你 : 如 果 你 即将 参 
出 果 义 et BE (Ww, Pp) ， 且 wp > nd > 5， 则 可 以 使 用 义 ~N (np, 加 统计 学 考试 ， 一 定 要 问 清 
楚 考 试 委 员 会 的 要 求 。 


woq 近 仅 代替 二 项 分 布 。 
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族 化 绒 习 


在 应 用 正 态 分 布 解决 “转椅 诀 遍 亮 ” 的 40 个 问题 之 前 ， 让 我 们 先 用 一 个 简单 问题 验证 一 下 
这 种 方法 的 有 效 性 。 让 我 们 试 著 算 一 算 : 在 12 个 问题 中 答对 5 题 或 5 题 以 下 的 概率 ， 其 中 
每 个 问题 只 有 两 个 备 选 答案 。 





让 我 们 首先 用 二 项 分 布 进行 计算 ， 即 求 出 P(X < 6)， 其 中 X ~ B(12, 0.5)。 





390 深入浅出 统计 学 


超越 正 态 


现在 ， 让 我 们 用 二 项 分 布 的 正 态 近似 法 进行 计算 ， 看 看 是 否 能 得 出 相同 答案 。 首 先 ， 如 果 X ~ B{12, 0.5)， 
我 们 可 以 用 哪个 正 态 分 布 进行 近似 计算 ? 弄 清楚 这 个 问题 后 ， 请 问 PIX < 6) 是 多 少 ? 
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旋 化 练习 解答 





在 应 用 正 态 分 布 解决 “转椅 赢 襄 襄 ”的 40 个 问题 之 前 ， 让 我 们 先 用 一 个 简单 问题 验证 一 下 
这 种 方法 的 有 效 性 。 让 我 们 试 着 算 一 算 : 在 12 个 问题 中 答对 5 题 或 5 题 以 下 的 概率 ， 其 中 
每 个 问题 只 有 两 个 备 选 答案 。 


让 我 们 首先 用 二 项 分 布 进行 计算 ， 即 求 出 P(X < 6)， 其 中 X ~ B(12, 0.5)。 


各 个 概率 用 下 到 公式 进行 计算 : 


1 
PH = = "Opa 其 中 “ 心 = 2 


rlfw -ji 


载 们 需要 囊 P 人 < 6]， 其 中 X 一 已 (12 0.5)， 为 岂 ， 需 要 刺 
F(X=0) 至 P(X=5)， 然 后 将 算 宴 的 所 有 概率 加 起 来 。 


各 个 概率 为 : 
PX=0 = "0 x0.5= 0.5 
PX=1)= "0 x0.5x0.5! = 12x0.5" 
P(X=2) = "0, x0.5x0.5r= 66 x0.5" 
PX=3)= "0, x0.5 x0.5° = 220 x 0.57 


PX=P)= ?0, x D.54 x 0.5 = 495 x 0.57 


P(X =5) = "C0, x0.57 x0.57 = 792 x 0.5" 


将 咏 上 概率 加 起 来 ， 得 到 总 柱 率 为 ， 


P<6) = (1+12+66+ 220+ 495 + 792) x 0.5'? 


= 1586 x 0.5'2 


二 0.387 (保留 三 位 小 数 ) 
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超越 正 态 
















现在 ， 让 我 们 用 二 项 分 布 的 正 态 近似 法 进行 计算 ， 看 看 是 否 能 得 出 相同 答案 。 首 先 ， 如 果 X ~ B(12, 0.5)， 
我 们 可 以 用 哪个 正 态 分 布 进行 近似 计算 ? 弄 清 楚 这 个 问题 后 ， 请 问 PIX < 6) 是 多 少 ? 


义 一 蕊 (12. 0.5]， 即 ww=12P=0.5，Q=05， 恰当 的 近似 作 市 为 一 NInp wpq) ， 也 就 是 X 一 N(6, 3)， 
我 们 要 事 P{X < 6)， 所 以 先 计 算 标准 莽 : 


其 一 上 


查 概 率 胡 ， 得 : 


P(X <6)=0.5 








我 澳 排 什么 内 容 设 听 
到 蚂 ? 为 什么 说 这 个 分 
证 是 “恰当 的 ”? 


两 种 概率 计算 方法 得 出 了 截然 不 同 的 结果 。 


和 通过 二 项 分 布 算得 的 P(X<6) 等 于 0.387， 而 通过 正 态 分 布 算 得 的 结果 为 0.5。 
我 们 倒是 可 以 用 正 态 分 布 代替 二 项 分 布 ， 但 是 ， 结 果 不 够 接近 。 


食 动 动脑 


你 觉得 错 在 哪里 呢 ? 我 们 该 如 何 进行 修正 ? 
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再 谈 正 态 近 似 


错 在 哪里 ? 让 我 们 仔细 研究 这 个 问题 ， 看 看 能 否 发 现 蹊跷 ， 能 和 否 想 出 办 法 进 
行 处 理 。 

首先 看 概率 分 布 X ~ B(12, 0.5)， 我们 想 求 出 答对 的 问题 不 足 6 个 的 概率 ， 并 已 
通过 计算 P(X < 6) 获 得 答案 。 


0.20 
0.15 
0.1 
Q:5 
们 将 这 些 概 率 相 
en Be 


然后 我 们 用 X ~ N(6, 3) 对 这 个 分 布 进行 近似 ， 根 据 需要 ， 为 了 求 出 二 项 分 布 的 
概率 P(X < 6)， 我 们 用 正 态 分 布 计算 P(X < 6): 


PX < 6) 是 这 一 部 分 面积 





进一步 仔细 观察 两 种 概率 分 布 。 虽 然 不 易 察 觉 ， 但 两 者 之 间 确 实 存在 重大 差 
别 : 我 们 分 别 用 于 计算 两 个 概率 的 两 个 范围 略 有 不 同 。 在 计算 正 态 分 布 的 时 
候 ， 我 们 使 用 的 实际 范围 略微 大 一 些 ， 这 正 是 概率 变 大 的 原因 。 


下 一 页 将 详细 讲解 这 个 问题 。 
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超越 正 态 


二 项 分 布 是 离散 分 布 ， 正 态 分 布 则 是 连续 分 布 
我 们 在 对 前 面 的 两 种 概率 进行 计算 时 忽略 了 一 件 事 一 没有 考虑 到 其 中 一 种 分 布 是 
离散 分 布 ( 二 项 分 布 ) ， 而 另 一 种 分 布 是 连续 分 布 ( 正 态 分 布 ) 。 这 很 重要 ， 因 为 
我 们 所 用 的 概率 范围 会 大 大 影响 最 终 概率 。 


以 下 在 同一 张 图 上 体现 了 X ~ B(12, 0.5) 和 N(6, 3) 这 两 种 概率 分 布 。 我 们 特别 指出 了 
正 态 分 布 所 用 概率 范围 超出 二 项 分 布 所 用 范围 的 部 分 。 






二 “高 P(X 6) 时， 这 一 
+ senna 
z 分 布 计算 P(X < 6) 时 ， 则 将 这 块 面积 
0 人 = 
0.5 Eo 
oe 的 aa 二 
1 2 3 4 5 6 7 8 9101i 


你 能 看 出 问题 所 在 吗 ? 


当 我 们 从 一 个 离散 概率 分 布 中 取出 一 些 整数 ， 并 将 这 些 整数 转化 为 连续 标 度 时 ， 我 
们 所 观察 的 并 不 仅仅 是 那些 精确 的 孤立 数值 ， 相 反 ， 我 们 观察 的 是 由 多 个 数字 形成 
的 范围 ， 这 些 数 字 经 过 取 整 ， 得 到 的 正 是 我 们 取 用 的 那些 精确 的 离散 整数 。 


让 我 们 以 离散 数值 6 为 例 ， 当 我 们 将 数字 6 转化 成 一 个 连续 标 度 时 ， 我 们 需要 考虑 所 
有 取 整 后 等 于 6 的 数字 ， 即 ， 从 5.5 到 6.5 的 整个 数字 范围 。 ,岁数 值 象 
区 整 后 均 为 6。 
5 5.5 6 6.5 7 
这 对 于 我 们 的 概率 问题 有 什么 影响 呢 ? 


此 前 我 们 试 着 用 正 态 分 布 近似 计算 答对 题 数 在 6 以 下 的 概率 时 ， 没 有 注意 到 离散 数值 
6 转变 成 了 连续 标 度 。 可 实际 上 ， 离 散 数值 6 包含 了 从 5.5 到 6.5 之 间 的 一 个 范围 ， 因 此 ， 
我 们 不 应 该 计算 P(X < 6)， 而 应 该 试 着 计算 P(X < 5.5)。 


这 种 调整 被 称 为 连续 性 修正 。 在 将 离散 数值 转换 为 连续 标 度 时 ， 所 作 的 小 幅 调整 就 是 
连续 性 修正 。 
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在 计算 近似 值 之 前 先 砍 行 种 续 性 修正 


让 我 们 斌 着 求 出 P(X < 5.5)， 其 中 X ~ N(6, 3) ， 看 看 这 个 概率 与 答对 5 题 或 5 题 以 下 的 
概率 的 近似 程度 如 何 。 之 前 我 们 已 经 利用 二 项 分 布 求 出 目标 概率 为 0.387 左 右 。 


让 我 们 看 看 正 态 分 布 得 到 的 结果 的 近似 程度 有 多 大 。 


我 们 想 求 P(X < 5.5)， 其 中 X ~ {6, 3), 让 我 们 先 算 标准 分 。 








着 看 这 而 个 概率 ， 的 
确 十 分 近似 ， 看 杂 这 
= -0.29 (保留 两 位 小 数 ) 插 性 修正 就 功 了 。 


我 们 想 求 面 积 Z < -0.29 的 概率 ， 于 是 查找 标准 正 态 概率 表 ， 得 到 概率 为 0.3859。 即 : 
P(X < 5.5) = 0.3859 


这 个 概率 和 我 们 用 二 项 分 布 求 得 的 概率 十 分 近似 一 之 前 用 二 项 分 布 算得 的 概率 为 
0.387， 因 此 正 态 分 布 得 到 的 是 十 分 近似 的 结果 。 


习 


aa 
和 ”在 一 些 特定 情况 下 ， 可 以 用 正 态 ss 如 果 用 正 态 分 布 近似 代替 二 项 分 

分 布 近似 代 蔡 二 项 分 布 。 如 果 布 ， 则 需要 进行 连续 性 修正 ， 这 才 

Xx~B(n, p), Bnp > 5, nq > 5， 能 确保 得 到 正确 的 结果 。 

则 可 以 用 X~N(np,np9q}) 近 似 代 

痊 X。 
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超越 正 态 


选 续 性 修正 细 细 和 希 


使 用 正 态 分 布 近似 代替 二 项 分 布 有 一 个 技巧 ， 即 务必 进行 合适 的 连续 性 修正 。 如 上 
所 见 ， 所 选 概率 范围 的 小 小 变化 会 导致 实际 得 到 的 概率 出 现 重 大 误差 。 听 起 来 这 似 
乎 不 是 什么 了 不 起 的 大 问题 ， 可 是 ， 使 用 错误 的 概率 将 会 导致 做 出 错误 的 决策 。 


让 我 们 看 看 针对 各 种 概率 问题 需要 使 用 的 各 种 连续 性 修正 。 


















魏 型 概率 的 求解 你 过 要 用 PC < / A 
) .A 


在 计算 P(X < a ) 这 种 形式 的 概率 时 ， 关 键 是 要 确保 所 选择 的 范围 中 包含 
离散 数值 a。 在 一 个 连续 标 度 上 ， 离 散 数 值 a 会 增长 到 (a + 0.5)。 这 就 是 
说 ， 如 果 使 用 正 态 分 布 求 P(X < a )， 则 实际 上 需要 计算 P(X< a+ 0.5)， 以 
此 得 出 近似 值 ， 换 句 话 说， 你 要 增加 一 个 额外 的 0.5。 


二 型 概率 的 求解 


在 计算 P(X>b) 这 种 形式 的 概率 时 ， 一 定 要 确保 所 选择 的 范围 中 包含 离 
散 数值 b。 在 一 个 连续 标 度 上 ， 离 散 数值 b 会 减 小 到 (b - 0.5)。 这 就 是 说 ， 
你 需要 使 用 范围 PIX>b - 0.5)， 这 样 才能 确保 该 数值 位 于 这 个 范围 内 ， 
换 句 话说 ， 你 需要 减 去 一 个 额外 的 0.5。 


6 Sr 10 11 


8.5 








“ 介 于 ” 型 概率 的 求 角 我 们 用 P(1.5 之 XX < 


在 计算 P(a < X < b) 这 种 形式 的 概率 时 ， 需 要 进行 连续 性 修正 ， 以 便 确保 35) 书 ?C2 <X 三 2。 
a 和 b 均 包含 在 内 。 为 此 需要 将 两 端的 范围 均 扩展 0.5。 为 了 使 用 正 态 分 
布 近似 计算 这 个 概率 ， 我 们 需要 求 Pla- 0.5 < X < b+ 0.5)， 这 正好 是 以 
上 两 种 概率 类 型 的 综合 。 
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阅 :用 正 态 分 布 近似 计算 二 项 分 
布 的 确 能 节省 时 间 吗 ? 


签 : 可 以 节省 大 重 时 间 。 计 算 
二 项 概率 时 ， 通 常 必须 计算 大 重 数 
值 的 概率 ， 因 此 十 分 费时 ， 没 有 什 
么 方法 能 够 简便 地 计算 一 个 数值 范 
围 内 的 所 有 二 项 概率 。 


如 果 用 正 态 分 布 近 似 计 算 二 项 分 布 ， 
那 就 快 多 了 ， 你 可 以 在 标准 表 中 查 
找 概率 ， 一 口气 把 整个 教 据 范围 的 
概率 算出 来 。 


阅 : 确实 能 得 到 精确 结果 吗 ? 


签 : 法 错 ， 在 大 多 数 博 况 下 都 
足够 精确 。 但 要 记 住 ; 需要 进行 连 
续 性 修正 。 如 果 不 进 行 连 续 性 修正 ， 
则 结果 的 正确 性 将 下 降 。 


世上 没有 傻 问题 


阅 ; 怎么 对 < 和 > 进行 连续 性 修 
正 ? 像 < 和 > 一 样 进行 处 理 吗 ? 
每 有 差别 的 ， 这 要 看 你 要 包 


念 哪 个 数值 ， 要 排除 哪个 数值 。 


在 用 < 和 > 计算 概率 的 时 候 ， 体 需要 
确保 不 等 式 中 的 数值 落 在 已 知 概率 
范围 之 内 。 因 此 ， 假 如 要 计算 P(Xs 
10)， 则 需要 确保 数值 范围 中 包含 10， 
即 需要 考虑 P(X < 10.5)。 


在 用 < 或 > 计算 概率 时 ， 你 需要 确保 
不 等 式 中 的 琢 值 落 在 已 知 概 率 范 围 之 
外 。 即 ， 假如 要 计算 P(X<10)， 则 需 
要 确保 数值 范围 中 不 包含 10， 即 需 
要 考虑 P(X < 9.5)。 


间 : 正 坊 分布 和 泊 松 分 布 都 能 作 
为 二 项 分 布 的 近似 ， 我 该 用 哪 一 个 ? 


签 : 这 要 看 具体 情况 。 如 果 X- 
Bln, p)， 当 np > 5 且 nq > 5 时 ， 划 使 
用 正 态 分 布 近似 代替 二 项 分 布 。 


如 果 n > 50 且 p < 0.1， 则 可 以 使 用 泊 
松 分 布 近似 代替 二 项 分 布 。 


记 住 : 在 用 正 态 分 布 近似 代 蔡 二 项 分 布 时 ， 必 须 讲 行 连 续 性 修正 。 
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等 炒汇 


你 的 任务 是 从 奇妙 池 中 捞 出 公式 因子 ， 
将 这 些 因子 放 入 计算 式 中 的 横 线 
上 ， 目 的 是 为 每 一 种 离散 概率 范 
围 提供 正确 的 连续 性 覆 正 。 同 一 
因子 可 以 多 次 使 用 ， 不 必 使 用 所 





有 因子 。 
X<3— X = 0 — 
X>3 一 ~ 3 三 X<10 一 = 
人 3<X<10 一 
XP X>0— 


3<X<10— 


3<X< 10 一 


说 明 : 从 池 中 捞 出 的 
每 一 个 因子 均 可 以 多 
次 使 用 ! 
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等 炒 池 解 管 


你 的 任务 是 从 奇妙 池 中 捞 出 公式 因子 ， 
将 这 些 因 子 放 入 计算 式 中 的 横 线 





上 ， 目 的 是 为 每 一 种 离散 概率 范 
围 提供 正确 的 连续 性 修正 。 同 一 从 -0.5 到 0.5 的 所 有 数 取 整 后 
因子 可 以 多 次 使 用 ， 不 必 使 用 所 者 等于 0， 困 此， 必须 将 这 
此 数值 包含 在 数值 范围 内 
Pa 
我 们 要 找 出 小 于 
3 的 数值 .2.5 取 X<3 _w X< 2.5 XO “EX EAS 
整 等 于 3， 因 此 ， 
我 们 只 想 让 数值 X>35 
范围 中 包含 小 于 X> 3 一 > 2 3<x<sz10—> 2.5<X<10.5 
2.5 的 数 . 
在 这 个 式 孚 中 ， 一 
我 们 所 页 的 是 
小 于 等 于 3 的 数 X > 3 一 > > 2.5 灾 和 和 0 一笑 兴 洲 5 
值 ，2.5 到 3 之 
间 的 数值 取 整 2.5< XX <95 
后 都 等 于 日 3 < X“ 10 一 一 -一 3<X<10 一 = SSCSXKG.S 
此 需要 将 小 于 
3.5 的 数值 包含 
在 数值 范围 中 ， 


说 明 : 从 池 中 捞 出 的 
每 一 个 因子 均 可 以 多 
次 使 用 ! 
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超越 正 态 


在 今天 这 一 期 "转椅 赢 赢 赢 ”节日 中 ， 你 记得 累计 奖金 的 概率 有 多 大 ? 看 看 你 能 不 能 求 出 
钛 习 在 40 个 问题 中 答对 30 题 的 概率 ， 每 个 问题 有 4 个 备 选 答案 。 
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在 今天 这 一 期 “转椅 赢 赢 赢 ” 节 目 中 ， 你 赢得 累计 奖金 的 概率 有 多 大 ? 看 看 你 能 不 能 求 出 
习 在 40 个 问题 中 答对 30 题 的 概率 ， 每 个 问题 有 4 个 备 选 答案 。 


解答 
如 果 X 为 答对 的 问题 的 数目， 那么 我 们 要 囊 P(X 30) ， 其 中 X 一 忆 (40, 0.25). 


由 于 wp 与 nq 坊 大 于 ， 所 以 适合 用 正 态 分 和 布 近 似 守 兽 这 个 概率 .up = 10，wha = 30， 于 是 我 们 需要 事 
P(X > 29.5)， 其 中 义 一 N(10, 30), 









社 我 们 先 书 标准 分 : 


在 揽 率 衣 中 查找 0.65。 得 到 概率 0.7422。 即 ， 


P(X > 29.5) = 1 -~ 0.7422 
= 0.2578 





所 以 ， 看 来 你 只 有 26%% 鬼 几率 
赢得 转椅 。 要 是 过 外 了 藉 ， 就 
会 糟 失 我 们 的 特大 吉 励 奖 一 撑 
矛 快 拿 了 鼓励 甘南 场 ? 
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超越 正 态 










看 你 高 去 让 人 心 伤 ， 你 能 参加 比赛 真 的 祖 
樟 . 未 过 ， 我 们 刚刚 收 到 一 侍 电 也 邮件 ， 
发 件 人 名 叫 德 克 -…… 
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正 态 分 布 访谈 


404 


组 合 访 谈 


本 周 话题 : 


为 什么 “ 正 ” 不 等 于 “ 闲 ” 


Head First: 嗨 ， 正 态 兄 ， 真 高 兴 你 能 来 参加 节目 。 
Normal: 谢谢 你 邀请 我 ，Head First。 


Head First: 现在 ， 我 的 第 一 个 问题 与 你 的 名 字 有 
关 。 你 为 什么 叫做 “ 正 态 ”? 


Normal: “ 正 态 ”是 中 文 说 法 ， 其 实 ， 在 英语 里 ， 
我 的 名 字 是 “normal”， 意 思 是 “常见 的 ， 典 型 
的 ”， 主 要 是 因为 我 能 恰当 代表 多 种 多 样 的 数据 类 
型 。 这 些 数据 的 概率 分 布 具有 独特 的 形状 一 钟 
形 ， 十 分 平滑 ， 这 正 是 我 。 我 可 以 说 是 理想 型 吧 。 


Head First: 可 以 举 一 个 例子 吗 ? 


Normal: 当然 可 以 ,假设 你 开 了 一 家 点 心 店 ， 店 里 
出 售 各 种 面包 。 理 论 上 每 一 块 特定 品种 的 面包 都 应 
该 重量 相同 ， 但 实际 上 每 一 块 面包 的 确切 重量 会 有 
波动 。 

Head First: 不 过 ， 这 些 面包 称 起 来 肯定 一 样 重 吧 ? 


Normal: 大 致 一 样 ， 但 存在 偏差 。 我 为 这 种 偏差 
建 模 。 


Head First: 建立 模型 为 什么 这 么 重要 ? 


Normal: 嗯 ， 这 表示 你 可 以 用 我 来 计算 概率 。 假 设 
你 随机 选取 一 块 面包 ， 要 计算 这 块 面包 的 重量 小 于 
某 个 特定 值 的 概率 一 这 听 起 来 像 是 十 分 难 办 ， 不 
过 ， 有 我 在 就 简单 了 。 


Head First: 简单 ? 你 指 的 是 ? 
Normal: 其 他 许多 概率 分 布 会 牵涉 到 大 量 错综复杂 
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的 计算 。 二 项 分 布 需要 使 用 阶乘 ; 泊 松 分 布 需要 计 
算 短 指数 ， 而 我 不 用 算 这 些 。 只 要 在 概率 表 中 查 一 
查 ， 就 解决 了 。 


Head First: 肯定 没 这 么 容易 吧 ? 


Normal: 哦 ， 首 先 要 把 我 转化 成 标准 分 ， 不 过 这 不 
足 挂 上 元 ， 无 碍 大 局 。 


Head First: 告诉 我 ， 你 是 否 觉得 自己 比 别 的 概率 
分 布 都 强 一 些 ? 


Normal: 我 不 会 说 我 比 别 的 概率 强 多 少 ， 不 过 我 倒 
是 灵活 许多 ， 在 很 多 地 方 都 派 得 上 用 场 。 我 也 更 健 
全 ， 当 泊 松 分 布 和 二 项 分 布 的 数字 变 得 很 大 时 ， 他 
们 就 会 遇 上 麻烦 。 话 说 回来 ， 我 会 尽力 帮忙 的 。 
Head First: 是 吗 ? 怎么 帮 呢 ? 

Normal: 哦 ， 在 某 些 情况 下 ， 二 项 分 布 和 泊 松 分 布 
看 上 去 都 和 我 相似 ， 这 一 点 颇 为 诡异 。 在 聚会 上 ， 


常常 有 人 拦住 他 们 ， 问 他 们 是 不 是 正 态 先 生 ， 我 对 
他 们 说 ， 就 当 别 人 在 恭维 你 们 吧 。 


Head First: 这 能 带 来 什么 帮助 呢 ? 


Normal: 哦 ， 由 于 他 们 看 上 去 像 我 ， 实 际 上 就 可 以 
用 我 的 概率 表 算 出 他 们 的 概率 。 用 处 有 多 大 ? 那 就 是 
再 也 不 用 深 更 半夜 地 拿 计算 器 了 ， 只 需 一 个 字 : 查 。 
Head First: 由 于 时 间 关 系 ， 看 来 今天 只 能 谈 到 这 
儿 了 。 正 态 先 生 ， 谢 谢 你 的 到 来 ， 采 访 你 真 愉快 。 


Normal: 别 客气 ，Head First。 


超越 正 态 


大 家 堂上 丑 情 过 册 车 


还 记得 德 克 的 爱情 过 山 车 吗 ? 他 已 经 开始 请 人 试 坐 ， 每 一 个 试 坐 过 的 人 都 觉得 很 棒 。 
只 有 一 个 问题 : 过 是 车 有 时 候 会 发 生 故 辜 ， 故 障 导 致 延迟 ， 延 迟 导致 耗 钱 。 


关于 正在 试用 的 这 款 过 山 车 ， 德 克 在 网 上 找到 了 一 些 统计 数据 ， 其 中 一 个 网 站 说 可 
以 预期 的 故障 次 数 为 每 年 40 次 。 











六 年 40 决 ?1 要 是 过 山芋 
在 某 对 新 人 的 蜂 礼 上 发 生 改 
障 ， 他 们 会 打 官 司 的 : 











看 在 过 山 车 肯定 能 赚 大 钱 的 份 上 ， 德 克 考 虑 ， 如 果 过 山 车 的 停机 概率 
低 于 每 年 52 次 ， 还 是 值得 十 下 去 的 。 


我 们 如 何 算出 这 个 概率 呢 ? 


这 种 情况 符合 哪 种 概率 分 布 ? 如 何 求 出 过 山 车 每 年 发 生 的 故障 
小 于 52 次 的 概率 ? 
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动 动笔 解答 


~ 蕊 蕊 区 


SEN 解 管 这 种 情况 符合 哪 种 概率 分 布 ? 如 何 求 出 过 山 车 每 年 发 生 的 故障 
小 于 52 次 的 概率 ? 










如 果 某 物体 以 某 种 平声 频率 发 生 故 障 ， 则 这 种 情况 符合 汽 松 分 布 ， 以 场 值 为 其 参数 。 风 果 义 表示 一 年 向 
的 故障 次 数 ， 则 X 一 Po(40) 。 


我 们 需要 事 P(X < 52) ， 为 此 ， 我 们 需要 求 出 52 以 内 的 所 有 X 值 分 别 对 冰 的 概率 . 


计算 这 个 概率 既 费 时 又 费力 ， 我 
者 虑 是 不 是 能 像 处 理 二 项 分 布 一 
样 ， 找 到 一 个 简便 算法 。 








在 某 些 特定 情况 下 ， 泊 松 分 布 的 形状 很 像 正 态 分 布 。 

所 带 来 的 好 处 是 ,我 们 可 以 利用 标准 正 态 概 率 表 算出 全 部 概率 ， 
即 不 用 为 了 求 得 最 终结 果 而 大 量 计 算 一 个 个 概率 。 

泊 松 分 布 的 正 态 近似 法 与 二 项 分 布 的 正 态 近 似 法 十 分 相似 : 先 认 
清 情 况 , 算出 泊 松 分 布 的 均值 和 方差 .然后 将 二 者 作为 正 态 分 布 
的 参数 

如 果 X ~ Po( 入 )， 表 示 相 应 的 正 态 近似 为 X ~ N( 和 A， 入 )。 什 么 时 候 
会 出 现 这 种 情况 呢 ? 


这 完全 取决 于 分 布 的 形状 。 
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超越 正 态 


何 时 能 周正 态 分 布 近似 代 蔡 油 松 分 布 
只 要 泊 松 分 布 的 形状 与 正 态 分 布 相似 ， 就 可 以 用 正 态 分 布 近似 代 葵 泊 松 分 布 。 
什么 时 候 会 出 现 这 种 情况 呢 ? 让 我 们 看 看 。 
当 入 很 小 


当 入 很 小 时 ， 泊 松 分 布 的 形状 与 正 态 分 布 不 相同 ， 图 像 不 对 称 ， 曲 
线 好 像 被 “ 扯 ” 向 了 右边 。 


由 于 泊 松 分 布 在 入 较 小 时 与 正 态 分 布 差别 很 大 ， 因 此 在 入 较 小 时 ， 
不 适合 用 正 态 分 布 近似 代替 泊 松 分 布 。 


当 入 很 大 …… 


随 着 A 变 大 ， 泊 松 分 布 图 的 外 形 看 起 来 越 来 越 像 正 态 分 布 。 曲 线 
的 主要 部 分 呈 合 理 对 称 ， 近 似 光滑 曲线 ， 与 正 态 分 布 接近 。 


即 ， 随 着 入 变 大 ， 正 态 分 布 越 来 越 适 合用 来 近似 泊 松 分 布 。 





多 大 放 算 足够 大 ? 


我 们 已 经 看 到 ， 当 入 较 大 时 ， 泊 松 分 布 与 正 态 分 布 相似 ， 不 过 ， 要 大 到 什么 程度 才 
能 用 正 态 分 布 进行 近似 呢 ? 


当 入 大 于 15 时 可 谓 足 够 大 。 即 ， 如 果 X ~ Po( 入 ) 且 入 > 15， 我 们 就 能 用 X ~ N( 入 ,入 ) 
近似 计算 X ~ Po( 入 )。 


重要 统计 量 
泊 检 分 布 的 近似 


出 果 X 一 Po( 入 ) 且 入 > 15， 则 可 用 X 一 N (入 , 入 ) 进 行 近似 。 
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近似 算法 练习 


德 克 的 爱情 过 山 车 发 生 故 障 的 次 数 符合 泊 松 分 布 ， 其 中 入 = 40。 
鳞 习 第 -年 的 故障 次 数 小 于 52 次 的 概率 有 多 大 ? 





AR 用 正直 近似 法， 
别 总 了 这 续 性 修正 ， 
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超越 正 态 


现在 该 考 考 你 的 统计 知识 了 。 填 写 下 表 ， 说 说 哪 种 正 态 分 布 适合 哪 种 情况 ， 需 要 满足 什么 
条 件 。 





X+Y 


其 ~ Nb oj YY ~ (py 0) 


区 -下 


X~ N(h oj Y~ (ho o> ) 


aX+b 


X ~ N(h, 0°) 


Xi + Xt 
X ~ Np, c9) 


X 的 正 态 近似 
X ~ B(n, p) 


X 的 正 态 近似 
X ~ Po(A} 
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练习 解答 


人 德 克 的 爱情 过 山 车 发 生 故障 的 次 数 符合 泊 松 分 布 ， 其 中 入 = 40。 
鲸 


pr 


第 一 年 的 故障 次 数 小 于 52 次 的 概率 有 多 大 ? 
盘 答 
地 时 用 XX 表示 一 年 向 网 故障 次 数 ， 刚 X 一 Po(40) 。 
由 于 入 级 大 ， 我 们 可 以 用 正 态 今 布 近似 代替 这 个 今 市 ， 即 可 以 用 


XX N(40, 40) 


我 们 需要 囊 故 障 次 数 小 于 52 的 概率 。 由 于 用 过 续 报 率 今 布 近 似 代替 离散 气 率 分 市 ， 所 
地 必须 进行 这 续 化 修正 。 我 们 不 应 将 52 计 算 在 内， 于 是 只 需要 事 PXS51.5。 


在 用 标准 正 态 表 查 出 概率 之 前 ,需要 先 计 算 标准 分， 





= 1.82 (保留 两 位 小 数 ) 


在 所 率 表 中 查找 以 上 和 结果， 得 到 0.9656， 邯 一 年 肉 易 故障 决 数 小 于 52 钢 概率 为 0.9656. 
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超越 正 芒 


现在 该 考 考 你 的 统计 知识 了 。 填 写 下 表 ， 说 说 哪 种 正 态 分 布 适合 哪 种 情况 ， 需 要 满足 什么 


X+Y 
X+Y~N(h + Hh, 02 + 02) X 与 Y 为 独立 变 
X~ Nh oj Y~ (bc 


X-Y 


x -站 ~ N(ns- hypo%+ 005) |X 与 1 为 独立 支 量 


X ~ Np, oj YY ~ (bo2) 
aX 二 bb 一 Na + b,a0’) 


Xu + XXX 
X, 十 Xi: 十 … 十 X. 一 Na wg) |XvXv…X 为 X 拘 莉 立 观察 结 宁 
X ~ Np, co9) 


X 的 正 坊 近似 ee 
X~ N(np, npa) 


X~ Blny p} 需要 进行 连续 性 修正 


X 的 正太 近似 入 > 15 
X ~ Po{A) 需要 进行 这 续 性 修正 
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要 点 和 世上 没有 傻 问题 


人 


在 特定 条 件 下 ， 可 以 使 用 正 态 分 布 


近似 泊 松 分 布 。 


从 :二 项 分 布 和 泊 松 分 布 都 可 以 
用 正 态 分 布 近似 表示 ， 那 么 几何 分 布 
可 以 吗 ? 正太 分布 能 近似 代替 几何 分 
布 吗 ? 


答 : 我 们 之 所 以 可 以 用 正 态 分 
布 近 似 人 代替 二 项 分 布 和 泊 松 分 布 ， 
是 因为 在 某 些 特定 情况 下 ， 这 两 种 
分 布 与 正 态 分 布 具 有 相同 的 形状 。 


而 几何 分 布 呢 ， 它 永远 也 不 会 和 正 
态 分 布 外 形 相 似 ， 困 此 ， 正 态 分 布 
绝 不 能 有 歼 地 近似 代替 几何 分 布 。 





布 ， 那么 ， 


旺 ” 如 果 X ~ Po(X 租 XA > 15， 则 可 要 进行 连续 性 修正 。 


以 用 X ~ NOA, 入 ) 近 似 X。 


世上 没有 俐 问题 


问 : 


松 分 布 ， 


答 ; 没 销 ， 这 是 因为 你 在 用 连 
续 概 率 分 布 近 似 代 蔡 离散 概率 分 布 ， 
因此 就 像 修 正二 项 分 布 一 样 ， 需 要 
对 泊 松 分布 进 行 连续 性 修正 。 


问 ;用 正 态 分 布 近似 代 蔡 二 项 分 
布 或 泊 松 分 布 有 什么 好 处 呢 ? 如 果 坚 
持 用 原来 的 分 布 ， 结 果 是 不 是 会 更 准 
确 呢 ? 


如 果 用 正 态 分 布 近似 代替 泊 
必须 进行 连续 性 修正 吗 ? 


@ 如 果 你 用 正 态 分 布 近似 代替 泊 松 分 
为 了 确保 结果 正确 ， 需 





mm 








答 ; ”如 果 使 用 原来 的 分 布 ， 结 
果 的 确 会 更 准确 ， 但 这 极 费 时 间 。 
如 果 你 想 通 过 二 项 分 布 或 泊 松 分 布 
求 出 一 个 数值 范围 的 概率 ， 就 需要 
求 出 该 数值 范围 中 的 每 一 个 单独 数 
值 的 概率 。 相 反 ， 使 用 正 态 分 布 则 
可 以 查找 整个 范围 的 概率 ， 这 样 就 
大 大 地 简化 了 。 


用 正太 分 布 近似 代 蔡 泊 松 分 布 时 ， 要 进行 连续 性 修正 。 
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婚礼 成 功 : 


经 过 你 高 明 的 统计 分 析 ， 爱情 过 山 车 开张 了 ， 
.部 分 顾客 ， 看， 他 们 多 幸福 ! 


客户 需求 比 德 克 的 最 高 预期 还 要 旺 


盛 下 面 就 是 德 克 的 
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10 统计 抽样 的 运 膨 








别 必 ， 放 轻松 ,一 点 
也 不 疫 。 


统计 需要 处 理 数 据 ， 数 据 从 何 而 来 ? 

有 时 候 数 据 很 容易 收集 一 例如 参加 一 家 健身 俱乐部 的 人 员 的 年 龄 ， 或 一 家 游戏 公 
司 的 销售 数据 。 但 有 时 候 不 太 容易 ， 这 时 候 该 怎么 办 ? 一 当 事 件数 量 十 分 庞大 时 ， 
很 难 决定 该 从 何 处 着 手 收集 数据 。 在 本 章 中 ， 我 们 将 看 看 如 何在 实际 工作 中 成 功 收 
集 数据 一 有 效 地、 正确 地 、 省 时 省 钱 地 收集 数据 。 欢 迎 来 到 抽样 天 地 。 


进入 新 的 篇 章 
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曼 帝 糖果 公司 口味 检验 难题 


曼 帝 糖果 公司 口味 检验 

曼 帝 糖果 公司 是 一 家 糖果 和 巧克力 主要 供应 商 ， 超 长 效 口香糖 球 是 他 们 的 标志 性 产 
品 ， 这 种 产品 具有 五 彩 缤纷 的 颜色 ， 可 以 满足 各 种 口味 。 

曼 帝 糖果 公司 打算 大 做 电视 广告 ， 吸 引 更 多 的 消费 者 ， 广 告 包 括 这 样 一 部 分 内 容 : 
宣传 口香糖 球 的 口味 持续 时 间 。 问 题 来 了 : 他 们 该 怎样 得 到 相关 数据 ? 

公司 决定 进行 口味 检验 ， 也 已 经 招聘 了 一 批 试 吃 者 帮忙 完成 检验 。 这 时 出 现 了 两 个 
问题 : 试 吃 者 吃 完 了 所 有 的 糖 球 ; 试 吃 者 的 牙齿 健康 问题 让 公司 破 费 不 少 。 












嗯 ， 第 1466 颗 糖 球 的 味道 在 55 
分 钟 后 就 消失 了 ， 但 第 1467 颗 在 1 
收 时 后 仍然 口味 浓郁 ……- 






拜托 ， 别 再 让 我 唱 糖 球 
了 ， 我 的 中 都 没 了 . 





抽取 样本 


糖 球 吃 光 了 


曼 帝 糖果 公司 口味 检验 发 生 了 重大 失误 一 试 吃 者 把 所 有 的 糖 球 都 吃 光 了 。 
这 不 仅 伤 害 了 试 吃 者 的 牙齿 ， 而 且 没 有 糖 球 可 卖 了 一 试 吃 者 嚼 过 的 糖 球 是 
不 能 拿 来 卖 的 。 

进行 口味 检验 的 目的 是 弄 清楚 糖 球 的 口味 持续 时 间 ， 但 这 真 的 意味 着 试 吃 者 
必须 尝 遍 每 一 粒 糖 球 吗 ? 


动 动 及 


为 了 确定 糖 球 的 口味 持续 时 间 ， 你 会 怎么 做 ? 需要 考虑 什么 ? 
将 答案 写 在 下 面 ， 尽 量 写 详细 些 。 






. pe 号 害 四 a EE 
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as、 








总 体 与 样本 


对 糖 球 样 本 而 非 糖 球 总 体 进 行 检验 


曼 帝 糖果 之 所 以 碰 到 问题 ， 是 因为 他 们 的 试 吃 检验 出 现 了 “ 试 吃 每 一 粒 糖 球 ”这 
个 环节 ， 这 个 环节 费时 、 费 钱 、 伤 牙齿 ， 并 且 剩 不 下 糖 球 卖 给 消费 者 。 


那么 ， 曼 帝 糖果 该 做 些 什么 改变 呢 ? 让 我 们 从 总 体 和 样本 的 差别 讲 起 。 六 于 总 体 指 的 
是 所 有 六 于 。 


糖 球 总 体 
目前 ， 曼 帝 糖 果 对 现 有 的 每 一 粒 糖 球 进行 口味 检验 ， 若 用 统计 术语 表达 ， 那 么 他 
们 是 在 用 总 体 进行 检验 。 
统计 学 上 的 总 体 指 的 是 准备 对 其 进行 测量 、 研 究 或 分 析 的 整个 群体 ， 可 以 是 人 、 
得 分 ， 也 可 以 是 糖果 一 关键 在 于 总 体 指 的 是 所 有 对 象 。 






普查 指 的 是 对 总 体 进行 研究 或 调查 。 在 曼 帝 糖果 的 实例 中 ， 他 们 对 每 一 粒 糖 球 进 
行 品 尝 ， 因 此 ， 是 对 糖 球 总 体 进行 普查 。 普 查 可 以 给 出 关于 总 体 的 准确 信息 ,但 
并 不 是 在 任何 情况 下 都 切实 可 行 。 当 总 体 数 量 很 大 ， 或 者 说 无 穷 无 尽 时 ， 就 不 可 
能 对 每 一 个 对 象 进行 研究 了 。 


糖 球 样本 


不 需要 尝 遍 所 有 糖 球 也 能 搞 清楚 糖 球 口味 持续 时 间 
总 体 ， 而 检验 样本 . 


一 个 统计 样本 就 是 从 总 体 中 选取 的 一 部 分 对 象 。 通 过 选取 样本 ， 使 其 恰 
当地 代表 总 体 ， 从 而 得 到 代表 总 体 的 一 个 子 集 。 对 于 曼 帝 糖果 来 说 ， 一 个 
口香糖 球 样本 就 是 所 选取 的 一 小 部 分 糖 球 ， 而 不 是 每 一 粒 糖 球 。 


仅 对 总 体 的 一 个 样本 进行 的 研究 或 调查 称 为 样本 调查 ， 在 多 数 情 况 下 ， 
进行 样本 调查 比 进行 普查 更 切实 可 行 ， 通 常 样本 调查 所 费 的 时 间 和 和 费 
用 都 较 低 ， 且 不 用 考虑 整个 总 体 。 由 于 不 使 用 总 体 ， 对 口香糖 球 进行 
样本 调查 则 意味 着 调查 完毕 后 还 会 剩 下 大 量 糖 球 。 





你 可 以 不 检验 


那么 如 何 利 用 样本 得 出 关于 总 体 的 结论 呢 ? 让 我 们 看 一 看 。 
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抽取 样本 


抽样 方法 


建立 一 个 好 样本 的 关键 是 尽量 选择 最 符合 总 体 的 样本 ， 如 果 样 本 具有 代表 性 ， 
则 表示 样本 具有 与 总 体 十 分 相似 的 特性 ， 进 而 意味 着 可 以 通过 样本 预测 出 总 体 
具有 哪 种 特性 。 

假定 你 用 一 个 具有 代表 性 的 口香糖 球 样本 检验 每 种 口香糖 球 的 口味 持续 时 间 ， 
检验 结果 的 分 布 可 能 如 下 所 示 : 

即使 只 是 试 吃 了 一 个 小 样本 的 口香糖 球 ， 你 也 能 
对 分 布 形状 得 出 印象 。 试 吃 数量 越 多 ， 图 形 形 状 
越 清 晰 。 例 如 ， 通 过 查看 抽样 分 布 的 形状 ， 可 以 人 口 看 六 于 的 口味 
对 总 体 分 布 的 中 心 位 置 得 出 初步 印象 。 LT 入 信 况 罗 这 里 网 吉 人 


让 我 们 将 这 张 图 与 实际 总 体 进行 比较 : 





持续 时 间 
总 休 图 

这 是 总 体 分 布 图 。 看 出 总 体 分 布 和 抽样 分 布 有 i 尽 座 并 不 完全 一 致 ， 

多 么 接近 了 吗 ? 数 但 口 看 精 玉 的 总 体 

人 入 果 乌 样本 的 结果 

比较 这 两 个 图 形 可 以 看 出 ， 尽 管 一 个 图 形 代表 所 员 有 相似 的 相关， 


有 的 口香糖 球 ， 男 一 个 图 形 仅 代表 其 中 一 些 糖 球 ， 
但 二 者 的 大 致 形状 十 分 相似 。 它 们 具有 一 些 共 同 
的 特点 一 -例如 数据 中 心 的 位 置 相同 ， 这 意味 着 可 
以 用 样本 数据 预测 总 体 数 据 。 









这 么 说 所 有 的 样 地 都 与 
其 父 级 总 体 分 布 相似 ? 
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并 非 所 有 样本 都 可 靠 


当 抽 样 有 误导 


但 愿 我 们 能 保证 每 一 个 样本 都 与 作为 样本 来 源 的 总 体 相 吻合 一 - 可 惜 ， 并 非 
每 一 个 样本 都 酷似 其 总 体 。 这 似乎 不 是 什么 大 问题 但是， 使 用 具有 误导 性 
的 样本 实际 上 会 导致 对 总 体 做 出 错误 的 结论 。 


例如 ， 设 想 你 为 了 检验 糖 球 口味 典型 持续 时 间 而 抽取 一 个 口香糖 球 样 本 ， 但 
这 个 样本 却 仅 包含 红色 糖 球 ， 这 时 ， 样 本 可 能 能 够 代表 红 球 ， 却 不 能 代表 总 
体 中 各 种 其 他 颜色 的 糖 球 。 如 果 用 这 个 样本 的 结果 推测 有 关口 香 糖 球 总 体 的 
信息 ， 最 终 会 对 口香糖 球 的 特性 形成 错误 结论 。 


使 用 错误 的 样本 会 导致 对 总 体 参数 (例如 均值 和 标准 差 ) 得 出 错误 的 结论 ， 你 
可 能 会 对 数据 形成 截然 不 同 的 观点 ， 进 而 做 出 错误 决策 。 

麻烦 在 于 ， 你 可 能 当局 者 迷 一 你 可 能 会 觉得 总 体会 如 此 这 般 ， 而 事实 却 并 
非 如 此 。 我 们 务必 建立 某 种 机 制 ， 确 保 样本 能 够 可 靠 地 代表 总 体 。 





我 们 想得到 这 个 结果 : 而 不 是 这 个 结果 : 


代表 性 样本 四 在 者 禄 


样本 和 总 体 县 
NC 有 相 人 形状 | 


人 
祥 杰 和 总 体 的 /总体 


分 布 系 一 衬 。 地 和 
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案件 : 消失 的 咖啡 销量 


星 巴 仕 咖 啡 店 首席 执行 官 想 在 店 里 销售 一 种 新 品牌 的 咖啡 ， 但 他 不 
确定 这 种 咖啡 是 否 受 客户 欢迎 。 他 让 新 来 的 实习 生 进 行 调查 ， 摸 清 
客户 的 想法 。 实 习 生 请 客户 品尝 新 品牌 的 咖啡 ， 然 后 把 客户 的 想法 
告诉 首席 执行 官 。 

Fy 种 这 位 实习 生 十 分 乐意 得 到 这 个 大 好 的 工作 机 会 ， 首 先 ， 他 已 

经 打听 到 ， 如 果 这 个 工作 干 得 好 ,月 底 将 得 到 一 份 奖金 ; 其 

次 ， 他 打算 向 星 巴 仕 的 友好 客户 分 发 免费 咖啡 ， 并 聆听 一 些 

积极 信息 ; 第 三 ， 他 一 直 在 找 借口 ， 想 和 他 常 驻 的 咖啡 店 的 一 

位 常客 一 一 位 很 特别 的 女孩 搭 话 ， 这 次 工作 正 是 一 个 机 会 。 


这 位 实习 生 做 完 调查 后 ， 兴 冲冲 地 跑 去 告诉 首席 执行 官 人 人 都 喜欢 
新 品牌 咖啡 ， 这 种 新 品牌 很 可 能 销量 火爆 。“ 太 好 了 ”,， 首席 执行 
官 说 ，“ 我 们 下 个 季度 就 推出 这 种 咖啡 。” 





当 新 品牌 咖啡 最 终 上 市 后 ， 销 量 很 不 好 ， 首 席 执 行 官 不 得 不 取消 这 
个 系列 。 你 觉得 问题 出 在 哪里 ? 


新 品牌 咖啡 为 什么 销路 不 佳 ? 
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抽取 样本 


421 


设计 样本 


如 何 设 计 样 本 


样本 的 作用 是 用 它 判 定 总 体 情 况 。 为 了 确保 得 到 正确 结果 ， 需 要 明智 地 选择 
样本 。 让 我 们 先 来 认 清 总 体 的 实质 ， 以 便 让 样本 尽量 具有 代表 性 


确定 目标 总 体 


首先 要 和 弄 清楚 目标 总 体 何在 ， 才 知道 样本 取 自 哪里 。 这 里 的 目标 总 体 指 的 是 你 正 
在 研究 的 、 并 且 打 算 为 其 采集 结果 的 群体 。 你 所 选择 的 目标 总 体 在 很 大 程度 上 取 
决 于 你 的 研究 目的 ， 例 如 ， 你 打算 收集 世界 上 所 有 的 口香糖 球 的 数据 ， 还 是 收集 
某 个 特定 品牌 或 某 个 特定 类 型 的 口香糖 球 的 数据 ? 


目标 总 体 要 尽 可 能 精确 ， 这 样 能 更 为 容易 地 得 出 尽 可 能 代表 总 体 的 样本 、 


或 们 需要 得 到 最 帝 公司 赵 长 
让 口 看 糖 球 的 数据 ， 因 此 你 
注目 标 加 体 是 所 有 口 看 粮 绊 ， 






确定 抽样 单位 


- 旦 确定 目标 总 体 ， 就 需要 决定 要 抽取 哪 一 类 对 象 ， 通 常 ， 要 抽样 的 对 象 类 型 就 是 
在 确定 目标 总 体 时 所 摘 述 的 对 象 类 型 ， 例 如 ， 可 以 是 一 粒 口香糖 球 ， 也 可 以 是 一 盒 
口香糖 球 。 


口味 检验 中 的 抽样 单位 
必 一 吓 一 粒 赵 长 交口 看 粮 妹 ， 
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口香糖 球 #1897653 
口香糖 球 #1897654 
口香糖 球 #1897655 
口香糖 球 #1897656 
口香糖 球 #1897657 
口香糖 球 #1897658 
口香糖 球 #1897659 
口香糖 球 #1897660 
口香糖 球 #1897661 
口香糖 球 #1897662 
口香糖 球 #1897663 


抽取 样本 
确定 抽样 空间 


最 后 ， 你 需要 列 一 张 表 ， 表 中 列 出 目标 总 体 范 围 内 的 

所 有 抽样 单位 ， 最 好 给 每 个 抽样 单位 取 个 名 或 编 个 号 。 
这 张 表 被 称 为 抽样 空间 ， 基 本 上 ， 你 可 以 从 这 张 表 中 选 
取样 本 

有 了 时候 不 可 能 得 出 涵盖 整个 目标 总 体 的 抽样 空间 表 ， 例 如 ， 
如 果 要 收集 生活 在 某 个 地 区 的 居民 的 观点 ， 由 于 人 口 流动 ， 
表 中 列举 的 名 字 就 会 受到 影响 ; 如 果 所 处 理 的 是 一 些 相似 
的 对 象 ， 例 如 口香糖 球 ， 那 么 为 每 一 粒 糖 球 命名 或 编号 恐 
怕 是 不 可 能 的 ， 或 者 说 是 不 现实 的 。 


邻 名 或 编号 可 能 孙 
是 那么 切实 可 行 ， 


口香糖 球 #1897670 
口香糖 球 #189767 
口香糖 球 #189' 
口香糖 球 #1 
口香糖 球 
口 香 粮 










这 似乎 是 在 滚 中 时 
间 ， 我 必须 完成 这 些 步骤 
吗 ? 我 和 不 能 抽取 几 个 糖 妹 
样 寺 就 完事 吗 ? 


如 果 不 好 好 设计 ， 样 本 有 可 能 不 精确 。 

设计 样本 需要 额外 付出 不 少 准备 时 间 ， 但 是 ， 
比 起 费时 、 费 钱 地 进行 调查 却 换 来 一 些 错误 结 
果 ， 这 要 好 多 了 。 后 者 会 让 金钱 和 时 间 付 诸 东 
流 ， 更 有 其 者 ， 恐 怕 会 有 人 根据 错误 的 调查 结 
果 做 出 错误 的 决策 。 

设计 不 当 的 样本 会 引起 偏 位 ， 让 我 们 详细 讲 讲 
这 一 点 。 
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抽样 偏 做 


样本 有 时 会 发 生 偏 伟 


并 非 每 一 个 样本 都 能 做 到 十 分 客观 一 - 除非 极其 小 心 ， 否 则 ， 样 本 中 会 潜 人 
这 样 那样 的 偏 倚 ,使 最 终结 果 发 生 扭 曲 。 你 在 无 意 间 ( 也 可 能 是 有 意 间 ) 带 
人 样本 的 某 种 个 人 偏好 就 是 偏 倍 ， 这 时 ， 你 的 样本 不 再 是 从 总 体 中 进行 随机 





选择 的 结果 。 
如 果 一 个 样本 无 偏 ， 则 这 个 样本 可 以 代表 总 体 ， 是 总 体 的 客观 反映 。 
无 争 构 村 无 偏 样 水 
场 值 相同 
频 Dn 无 偏 样本 可 以 代表 目标 总 体 ， 即 该 样本 与 
个 \ 总 体 样本 具有 相似 特性 ， 我 们 可 以 利用 这 
些 相似 特性 对 总 体 本 身 做 出 判断 。 
2 \, 一 个 无 偏 样本 的 分 布 形状 与 作为 其 来 源 的 总 
/ \ 体 的 分 布 形状 相似 ， 如 果 我 们 知道 样本 的 
PA 、 分 布 形状 ， 就 可 以 据 此 以 合理 程度 的 置信 
ea 水 平 预测 总 体 的 分 布 形 状 。 
持续 时 间 
偏 侍 样 本 
偏 倚 样 本 无 法 代表 目标 总 体 ， 由 于 样本 与 
数 总 体 的 特性 不 相似 ， 无 法 根据 样本 对 总 体 


做 出 判断 。 如 果 我 们 试图 用 样本 的 分 布 形 
状 预 测 总 体 的 分 布 形状 ， 最 终 将 会 得 出 错 
误 的 结果 。 
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抽取 样本 







听 起 来 让 人 绝 音 .我 怎么 能 肯定 有 没有 偏 倚 ? 
它 到 底 来 自 哪里 ? 


偏 倚 的 来 源 


偏 倚 是 怎么 溜 进 样本 里 的 ?下 面 是 部 分 原因 : 


和 抽样 空间 中 条 目 不 齐 全 ， 因 此 未 包含 目标 总 体 中 的 所 有 对 象 。 如 果 
条 目 不 出 现在 抽样 空间 中 ,那么 也 不 会 出 现在 样本 中 。 


和 抽样 单位 不 正确 。 例 如 ， 也 许 抽样 单位 不 应 该 是 一 粒 粒 的 口香糖 球 ， 
而 应 该 是 一 盒 盒 的 口香糖 球 。 

全 。 为 样本 选取 的 一 个 个 抽样 单位 未 出 现在 实际 样本 中 。 例如， 你 可 能 
发 出 一 份 调查 问卷 ， 但 并 不 是 人 人 都 给 出 回应 。 





si 设计 的 问题 要 中 性 ， 要 适合 每 个 人 回答 
例如 ，“ 曼 帝 糖 果 公 司 的 糖果 比 其 他 品牌 的 糖果 更 可 口 ， 您 同意 
吗 ? ”这 种 提问 带 有 偏 傈 ， 较 好 的 做 法 是 请 受 调查 者 自己 说 出 他 们 
偏爱 的 糖果 品牌 


和 @ 。 样本 缺乏 随机 性 。 例 如 ， 如 果 在 大 街 上 展开 调查 ， 你 可 能 会 回避 行 
色 匆 匆 或 气势 测 测 的 人 ， 于 是 你 就 将 气势 测 测 的 人 或 行 色 匆 匆 的 人 
排除 在 调查 范围 以 外 。 







你 是 说 我 不 能 只 试 吃 粉 
色 糖 球 ? ? 3? 


如 上 所 述 ， 偏 倚 来 源 广泛 ， 而 其 中 大 部 分 归咎 于 样本 选取 方法 。 
我 们 需要 检查 样本 的 选取 方法 ， 使 偏 倚 的 发 生 几率 降 至 最 低 程度 
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世上 没有 傻 问题 


| 间 : ”这么 说 抽样 空间 就 是 我 们 所 
抽取 的 所 有 对 象 的 列表 ? 


答 : 抽样 室 间 列 出 总 体 中 的 所 有 
独立 单位 ， 被 作为 样本 的 基础 ， 但 
它 并 不 是 样本 本 身 ， 这 是 因为 我 们 不 
会 抽取 抽样 空 间 中 的 所 有 对 象 。 


| 问 : 我 如 何 形成 抽样 空间 ? 


从 ， 上 有 具体 做 法 以 及 所 用 对 象 取决 
于 你 的 目标 总 体 ， 例 如 ， 如 果 你 的 目 
标 总 体 是 所 有 汽车 车 主 ， 那 么 可 以 
采用 汽车 车 主 花 名 册 ; 如 果 你 的 目 
标 总 体 是 入 读 某所 大 学 的 全 休学 生 ， 
那么 可 以 采用 大 学 注册 表 。 


阅 : 电话 簿 之 类 的 东西 怎么 样 ? 
能 作为 抽样 空间 吗 ? 


答 : 这 完全 取决 于 你 的 目标 总 
体 。 电 话 薄 上 不 列 出 未 装 电 话 的 家 
庭 ， 还 有 一 些 家 庭 尽 管 装 了 电话 ， 
但 会 选择 不 在 电话 和 薄 上 公开 。 如 果 
你 的 目标 总 体 是 有 公开 的 电话 号 码 的 
家 庭 ， 那 么 使 用 电话 簿 是 一 个 不 错 的 
主意 ; 如 果 你 的 目标 总 体 是 所 有 装 有 
电话 的 家 庭 或 甚至 是 所 有 家 庭 ， 那 么 
你 的 抽样 空间 不 会 十 分 精准 一 -这 会 
带 来 偏 倚 。 
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世上 没有 傻 问题 


| 问 : 我 总 是 能 拟定 抽样 空间 3? 


答 : 并 非 如 此 。 想 象 一 下 ， 假 如 
你 不 得 不 调查 海洋 中 的 所 有 鱼 类 一 
为 每 一 条 鱼 命名 、 编 号 是 不 可 能 办 
到 的 。 


奖 :我 必须 确定 一 个 目标 总 体 吗 ? 


答 : 不 错 。 你 需要 知道 你 的 目标 
总 体 是 什么 ， 这 样 才能 确保 样本 代 
表 总 体 。 仔 细 考 虑 目标 总 体 有 助 于 
避免 偏 倚 。 


如 果 你 正在 替 别人 做 抽样 ， 要 尽量 
搞 清楚 目标 总 体 是 什么 。 要 确保 自 
己 确切 地 知道 哪些 包含 在 总 体内 ， 哪 
些 排除 在 总 体外 。 


问 : 偏 倚 为 什么 如 此 有 害 ? 


签 :” 仿 倚 的 害处 在 于 会 导致 对 目 
标 总 体 做 出 错误 结论 ， 进 而 导致 做 
出 错误 决策 。 例 如 ， 如 果 你 仅仅 抽 
取 粉 色 口香糖 球 ， 对 于 全 部 粉色 粮 
球 来 说 ， 你 的 调查 结果 可 能 是 准确 
的 ， 但 对 于 粮 球 整体 来 说 却 未 必 准 
确 一 不 同 颜色 的 粮 球 之 间 可 能 存在 
重大 差异 。 


“每 星期 3 一 5 次 ”、 


| 问 : 调查 问卷 中 的 提问 如 何 导致 
偏 倚 ? 


答 : 


悄 潜入 。 


首先 ， 如 果 你 给 出 一 系列 描述 ， 然 
后 要 求 受 调查 者 表示 同意 或 不 同意 ， 
除非 受 调查 者 非常 反感 ， 否 则 表示 
同意 的 可 能 性 更 大 。 也 就 是 说 ， 调 
查 结果 将 会 偏向 同意 。 

若 你 给 出 一 组 可 能 答案 ， 但 并 未 涵 
盖 一 切 可 能 结果 ， 那 么 也 会 出 现 偏 
倚 。 例如， 假设 你 需要 向 别人 提问 
他 们 一 般 一 星期 锻炼 几 次 ， 如 果 你 
给 出 的 答案 是 “每 星期 大 于 5 次 ”、 
“每 星期 1 一 2 次 ” 
以 及 “我 不 重视 健康 ， 因 此 不 锻 
炼 ”， 那 么 就 会 导致 偏 傅 ， 因 为 有 
些 人 可 能 不 锻炼 身体 ， 但 他 们 并 不 
同意 “不 重视 健康 ”这 一 说 法 ， 也 
就 是 说 ， 他 们 无 法 回答 问题 。 


偏 全 常常 在 问题 设计 阶段 悄 


抽 开 样本 





考虑 下 面 这 些 情况 ， 你 会 选择 什么 作为 目标 总 体 ? 抽样 单位 是 什 
么 ? 你 会 如 何 拟 定 抽 样 空间 ? 进行 抽样 时 还 需要 考虑 哪些 问题 ? 


忆 荔 各 


1. 巧 口 华 公司 生产 巧克力 ， 他 们 为 节庆 季度 限量 生产 了 一 些 巧 克 力 ， 想 要 检验 这 些 巧克力 的 品质 。 


2. 统计 邦 健身 俱乐部 想 进 行 一 项 调查 ， 看 看 客户 对 他 们 的 设施 有 何 想法 。 
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考虑 下 面 这 些 情 况 ， 你 会 选择 什么 作为 目标 总 体 ” 抽 样 单位 是 什 
么 ? 你 会 如 何 拟定 抽样 空间 ? 进行 抽样 时 还 需要 考虑 哪些 问题 ? 


1. 巧 口 华 公 司 生产 巧克力 ， 他 们 为 节庆 季度 限量 生产 了 一 些 巧克力 ， 想 要 检验 这 些 巧 克 力 的 品质 。 


目标 总 条 是 全 部 限量 版 巧克力 ， 

抽 捍 草 位 是 一 块 巧克力 。 

抽样 空间 需要 涵盖 所 有 有 巧克力 ， 由 于 是 限量 生产 ,图 此 公司 哺 可 能 记录 生产 了 务 少 巧克力 ， 包 括 钥 一 
种 巧克力 的 数量 ， 

在 形成 样本 时 ， 沉 要 确保 样 夺 鱼 代表 总 体 ， 且 未 存在 偏 倩 。 如 果 这 一 批 限量 产品 包含 务 种 卖 型 的 巧 克 
力 ， 则 要 确保 样本 中 包含 盘 一 类 巧克力 。 


2. 统计 邦 健身 俱乐部 想 进 行 一 项 调查 ， 看 看 客户 对 他 们 的 设施 有 何 想法 。 
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目标 总 体 是 神 计 邦 健 身 伺 乐 部 网 所 有 害 户 . 
抽样 章 位 是 一 位 密 户 . 
抽样 空间 需要 亢 蓝 所 有 密 户 ， 有 可 能 让 乐 部 有 客户 老 名 册 ， 可 以 将 这 倚 范 名 册 作 为 抽样 空间 ， 


和 前 面 一 样 ， 你 需要 确 仍 样本 包 鲍 代表 总 体 且 没有 偏 倍 ， 即 确保 密 户 性 列 、 年 龄 等 等 都 钱 得 到 全 面 的 
体现 ， 
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抽取 样本 


破案 : 消失 的 向 啡 销量 


财 啡 为 什么 销量 不 佳 ? 5 吼 钟 


我 们 无 法 肯定 ， 但 很 有 可 能 是 因为 实习 生 所 调查 的 样 


本 人 群 并 未 代表 目标 总 体 。 AN 推 更 
首先 ， 实 习 生 希望 向 友好 客户 免费 派发 咖啡 ,而 且 | 解 笔 


希望 听 到 正面 回应 。 这 是 不 是 说 他 只 与 看 上 去 对 他 友 
好 的 客户 交谈 ? 他 是 得 到 了 客户 关于 咖啡 的 真实 评价 ， 还 
是 仅仅 曾经 询问 他 们 是 否 同 意 “ 咖 啡 味道 不 错 ”? 






实习 生还 希望 利用 这 个 工作 机 会 和 他 常 驻 的 咖啡 让 的 一 位 年 轻 女 党 
客 措 训 ， 他 是 不 是 把 大 部 分 时 间 都 花 在 这 家 店 里 了 ? 这 位 女孩 是 否 
影响 了 他 的 样本 选择 ? 


最 后 ， 首 席 执 行 官 推出 咖啡 的 季节 与 进行 调查 的 季节 不 同 ， 这 也 有 
可 能 影响 销量 。 所 有 这 些 因素 ， 或 者 其 中 的 部 分 因素 ， 都 有 可 能 导 
致 样本 有 误 ， 进 而 导致 了 错误 决策 。 
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简单 随机 抽样 


如 何 选择 样本 


我 们 已 经 讲 过 如 何 设计 样本 ， 也 已 经 讨论 过 需要 避免 哪 几 类 偏 倚 ， 现 在 我 
们 需要 从 样本 空间 中 选取 实际 样本 ， 该 怎么 选 呢 ? 


简单 随机 抽样 


一 种 做 法 是 随机 选取 样本 。 假 设 你 有 一 个 包含 N 个 抽样 单位 的 总 体 ， 
需要 选取 包含 n 个 抽样 单位 的 样本 。 简 单 随机 抽样 就 是 通过 随机 过 程 
选取 一 个 大 小 为 n 的 样 本 ， 所 有 大 小 为 n 的 可 能 样本 被 选中 的 可 能 性 
都 相同 。 


简单 随机 抽样 有 两 种 具体 做 法 : 重复 抽样 和 不 重复 抽样 。 


重复 抽样 


重复 抽样 指 的 是 : 在 选取 一 个 抽样 单位 并 记录 下 这 个 抽样 单位 的 相 
关 信 息 之 后 ， 再 将 这 个 单位 放 回 总 体 中 。 这 样 做 的 结果 是 某 个 抽样 
单位 有 可 能 被 选取 不 止 一 次 。 重 复 抽样 的 例子 有 : 决定 向 大 街 上 的 
行人 提问 ， 事 前 并 不 查看 是 否 已 经 向 该 行人 提问 过 。 当 你 拦住 行人 
请 他 们 回答 问题 ， 然 后 在 问 完 后 让 他 们 离开 ， 实 际 上 就 是 将 行人 放 
回 了 总 体 ， 这 意味 着 你 有 可 能 不 止 一 次 向 他 们 提问 。 


不 重复 抽样 


不 重复 抽样 指 的 是 : 不 再 将 抽样 单位 放 回 总 体 。 不 重复 抽样 的 例子 
有 : 口香糖 球 检验 -一 尝 过 的 口香糖 球 是 不 会 被 放 回 总 体 的 。 


党 过 的 口 看 粮 缔 不 会 被 放 
全 一 加 总 体 的 ， 因 此 这 是 一 个 
未 重复 简单 随机 抽样 . 
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如 何 选取 简单 随机 样本 


使 用 简单 随机 抽样 主要 有 两 种 方法 : 抽签 ,或 使 用 随机 编号 。 


抽签 


抽签 就 是 把 抽样 空间 中 的 成 员 的 名 字 或 编号 写 在 纸 上 或 是 球 上 ， 
然后 将 其 全 部 放 人 一 个 容器 ， 再 随机 取出 n 个 名 字 或 编号 ， 以 便 
得 到 足够 的 样本 单位 。 


随机 编号 生成 器 

如 果 你 所 处 理 的 是 一 个 大 型 抽样 空间 ， 抽 签 可 能 不 太 可 行 , 于 由 

这 时 ， 你 为 抽样 空间 的 每 个 成 员 编 一 个 编号 ,再 生成 一 组 共 n 个 0 者 糖 球 #4893 
随机 编号 ， 然 后 从 该 空间 中 取出 编号 等 于 所 生成 的 随机 编号 的 、 坟 | 口香糖 球 #42 


成 员 。 | 口香糖 球 #1897652 
重要 提示 : 确保 每 个 编号 的 生成 机 会 相同 ， 从 而 避免 偏 倚 。 


1 加 秘 荔 脑 


简单 随机 抽样 并 不 是 不 会 发 生 问 题 ， 你 觉得 会 在 哪里 出 错 ? 








抽取 样本 
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分 层 抽 样 、 整 群 抽样 及 系统 抽样 


其 他 类 型 的 抽样 


即便 是 简单 随机 抽样 也 免不了 有 问题 。 


使 用 简单 随机 抽样 时 ， 仍 然 存 在 样本 无 法 代表 总 体 的 可 能 性 ， 例 如 ， 可 能 你 
最 终 随 机 抽 到 的 全 是 黄色 口香糖 球 ， 却 错失 其 他 颜色 。 


怎么 避免 这 种 情况 呢 ? 


我 们 可 以 周 分 层 抽样 …… 


有 一 个 方法 可 以 取代 简单 随机 抽样 ， 即 分 层 抽样 。 这 种 抽样 类 型 将 总 体 分 割 为 
几 个 相似 的 组 ， 每 个 组 具有 类 似 的 特性 。 这 些 特 性 或 者 组 被 称 为 展 。 例 如 ， 我 
们 可 以 将 口香糖 球 划分 为 不 同 的 颜色 一 黄色、 绿色、 红色 及 粉色 ， 这 样 每 一 种 
颜色 就 形成 一 个 不 同 的 层 。 


完成 以 上 分 层 工 作 之 后 ， 就 可 以 对 每 一 个 层 进行 简单 随机 抽样 ， 确 保 最 终 样本 
中 具有 每 一 个 组 的 代表 。 为 此 需 查看 每 一 个 层 在 总 体 中 所 占 的 比例 ， 然 后 按照 
相应 比例 从 每 一 个 层 中 抽取 抽样 单位 。 例 如 ， 如 果 曼 帝 糖 果 公 司 所 生产 的 口 香 
糖 球 有 50% 是 红色 的 ， 那 么 样本 的 一 半 应 该 由 红色 口香糖 球 组 成 。 


我 们 从 每 一 层 中 轴 
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抽取 样本 


或 可 有 周 整 群 抽样 …… 


如 果 总 体 中 包括 大 量 相 似 的 组 或 群 ， 则 整 群 抽样 可 以 派 上 用 场 。 例 
如 ， 口 香 糖 球 可 能 会 按 盒 出 售 ， 每 一 盒 中 的 口香糖 球 的 数量 和 颜色 
组 成 都 相似 ， 于 是 每 一 盒 糖 球形 成 一 个 群 。 


进行 整 群 抽样 时 ， 不 是 对 抽样 单位 进行 简单 随机 抽样 ， 而 是 对 群 进 
行 简单 随机 抽样 ， 然 后 对 每 一 个 群 的 各 种 特性 进行 调查 。 例 如 ， 你 
可 以 对 一 盒 盒 口香糖 球 进行 简单 随机 抽样 ， 然 后 品尝 这 些 盒子 里 的 
糖 球 的 味道 。 


整 群 抽样 之 所 以 行 得 通 ， 是 因为 群 与 群 相互 之 间 很 相似 ， 另 外 它 还 

一 个 优点 ， 不 需要 使 用 总 体 抽样 空间 就 可 以 进行 整 群 抽样 。 例 如 ， 
如 果 你 正在 调查 树木 情况 ， 并 把 几 片 特定 的 森林 作为 群 ， 则 只 需要 了 
解 你 所 选 定 的 几 片 森林 中 的 树木 就 行 了 。 


整 群 取样 的 问题 在 于 可 能 做 不 到 完全 随机 。 例 如 ， 很 有 可 能 一 盒 包 装 
中 的 所 有 口香糖 球 都 是 同一 个 厂家 生产 的 一 如 果 有 不 同 生 产 厂家 ， 倪 精 球形 成 一 个 群 
你 就 不 能 选取 这 些 糖 球 。 


或 其 至 可 有 周 系 统 抽 样 


使 用 系统 抽样 时 ， 按 照 某 种 顺序 列 出 总 体 名 单 ， 然 后 每 k 个 单位 进行 
一 次 调查 ， 其 中 为 一 个 特定 数字 。 例 如 ， 可 以 选择 每 10 个 样本 抽样 
一 次 。 


相对 而 言 ， 系 统 抽样 既 快 捷 又 简单 ， 但 却 有 一 个 重大 缺陷 : 如 果 总 
体 中 存在 某 种 循环 模式 ， 则 样本 将 会 有 偏 倚 。 例 如 ， 如 果糖 球 的 生 
产 工 艺 造成 每 到 第 10 个 糖 球 就 是 红色 ， 那 么 你 最 终 抽 到 的 都 是 红色 
糖 球 ， 这 会 导致 你 对 总 体形 成 错误 结论 。 





你 可 以 条 10 个 糖 球 抽样 一 次 从 而 得 出 系统 抽样 ， 


人 ) 
人 i 
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世上 没有 傻 问题 


问 ;使 用 这 些 抽样 方法 能 保证 样 
本 不 存在 偏重 吗 ? 


每 :这些 方 法 无 法 保证 样本 不 存 
在 偏 情 ， 但 能 将 发 生 偏 全 的 几率 降 
至 最 低 程度 。 通 过 认真 思考 目标 总 
体 ， 通 过 认真 思考 如何 使 样本 代表 
总体 ， 会 更 有 机 会 得 到 元 偏 的 代表 
性 样本 。 


阅 : 我 必须 使 用 这 些 方法 吗 ? 不 
能 随机 选择 对 象 吗 ? 


答 : 随机 选择 对 象 就 是 简单 随机 
抽样 。 没 锚 ， 你 的 确 可 以 采用 这 种 方 
法 ， 但 有 一 点 要 小 心 : 你 的 样本 有 可 
能 无 法 代表 总 体 。 


阅 ;可 这 是 为 什么 ? 要 是 我 随机 
选择 对 象 ， 它 们 肯定 会 代表 目标 总 体 
的 。 


答 ; 示 一 定 。 你 看 ， 如 果 你 随 
机 选择 抽样 单位 ， 可 能 会 选 出 一 个 
无 法 有 效 代 表 目 标 总 体 的 样本 一 这 
纯 属 随 机 现象 。 讽 如 ， 如 果 完 全 随 
机 地 选择 统计 邦 健身 俱乐部 的 客户 ， 
有 可 能 选 出 的 都 是 同一 个 班 的 学 员 ， 
或 者 选 出 的 都 是 同一 种 性 别 的 学 页 。 
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世上 没有 盆 问 题 


还 会 出 现 这 样 的 情况 一 -你 觉得 自己 
是 在 随 宙 选择 ， 但 事实 并 非 如 此 。 例 
如 ， 如 果 你 在 进行 顾客 满意 度 调 查 ， 
但 却 任凭 顾客 自己 决定 是 否 回应 调 
查 ， 那 么 ， 鉴 于 顾客 只 有 得 到 充分 鼓 
励 才 会 给 出 回应 ， 你 城 终 得 到 的 可 能 
是 有 偏 样本 。 最 积极 参与 调查 的 顾客 
会 是 那些 最 满意 或 最 不 满意 的 顾客 ， 
那些 感受 不 强烈 的 顾客 发 表意 见 的 可 
能 性 则 较 小 ， 然 而 ， 可 能 正 是 这 部 分 
人 构成 了 总 体 的 主要 部 分 。 


间 : 要 是 我 增 大 样本 呢 ? 能 避免 
偏 倚 吗 ? 


息 : 样本 超大 ， 样 本 发 生 偏 全 的 
几率 越 小 ， 使 用 简单 随机 抽样 时 ， 这 
的 确 是 一 种 使 样本 偏 倚 几 率 最 小 化 的 
方法 ， 问 题 在 于 样本 越 大 ， 采 集 数 据 
所 需要 的 时 间 越 多 ， 工 作 越 繁杂 。 


阅 ; 分 层 抽样 和 整 群 抽样 有 何 
区 别 ? 


答 : 分 层 抽样 将 总 体 划分 为 不 
同 的 组 ， 或 者 中 做 层 ， 每 一 个 层 中 
的 所 有 抽样 单位 相互 之 间 尽 量 相似 ， 
也 就 是 说 ， 你 认定 一 些 特征 或 属性 ， 
例如 性 别 ， 将 其 作为 分 层 的 依据 。 一 
旦 将 总 体 划分 为 层 ， 就 能 对 每 个 层 
进行 简单 随机 抽样。 


整 群 抽 祥 的 目的 是 将 总 体 则 分 为 多 
个 群 ， 同 时 尽量 保证 群 与 群 相 似 ， 随 
后 通过 简单 随机 抽样 选取 群 ， 再 接 
着 就 是 对 这 些 群 中 的 对 象 进行 抽样。 


阅 ， 明白 了 。 这 么 说 ， 在 进行 分 
层 抽 样 时 ， 要 尽 可 能 让 每 一 个 层 不 一 
样 ; 而 在 进行 整 群 抽样 时 ， 要 尽 可 能 
让 每 一 个 群 相似 。 


等 : 


阅 :系统 抽样 怎么 讲 ? 


完全 正确 。 


签 :进行 系统 抽样 时 ， 先 选取 一 个 
数字 k， 然后， 每 到 第 k 个 对 象 就 讲 行 
抽取 ， 组 成 样本 。 这 种 抽样 方法 相当 
便捷 ， 但 这 并 不 是 说 你 的 抽样 一 定 可 
以 代表 总 体 。 实 际 上 ， 只 有 在 抽样 空 
间 中 不 存在 重复 模式 或 组 织 时 ， 这 种 
抽样 方式 才能 有 效 使 用 。 


培 : 抽签 听 起 来 很 老 套 ， 大 家 仍 
在 这 么 做 吗 ? 


签 ， 不 如 过 去 那样 常用 了 ， 不 过 
仍然 是 一 种 抽样 方法 。 


抽取 样本 


加 有 人 给 了 你 10 合 巧克力， 要 求 你 对 盒子 里 的 巧克力 进行 铀 样 ， 盒 子 里 有 和 白 巧克力 、 牛 奶 


链 刁 巧克力 和 黑 巧克力 。 你 的 目标 总 体 是 所 有 巧克力 ， 抽 样 单位 是 一 块 巧克力 。 


1. 如 何 用 简单 随机 抽样 解决 这 个 问题 ? 


2. 如 何 用 分 层 抽 样 解 决 这 个 问题 ? 


3. 如 何 用 整 群 抽样 解决 这 个 问题 ? 
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练习 解答 


加 有 人 给 了 你 10 盒 巧克力 ， 要 求 你 对 盒子 里 的 巧克力 进行 抽样 ， 盒 子 里 有 白 巧 克 力 、 牛 奶 
欠 三 巧克力 和 黑 巧 克 力 。 你 的 目标 总 体 是 所 有 巧克力 ， 抽 样 单位 是 一 块 巧克力 。 
解答 


1. 如 何 用 简单 随机 抽样 解决 这 个 问题 ? 


简单 随机 抽样 : 随机 选取 巧克力 ， 可 以 用 抽 莹 方式 .也 可 以 用 隧 机 编号 方式 ， 吕 此 一 来 ， 每 一 
块 巧克力 都 有 同等 的 抽 中 机 会 。 


2. 如 何 用 分 层 抽 样 解决 这 个 问题 ? 


分 层 抽 撞 ， 将 巧克力 分 药 示 同 易 层 ， 然 后 对 每 一 层 进行 简单 辽 机 抽样 .每 一 层 都 由 特性 相同 师 巧 
克 力 组 成 因此 可 以 按 败 巧克力 鹏 不 同类 型 进行 分 层 ， 可 以 将 负 巧 均 力 作为 一 展 ， 牛 粉 苞 直 力 
作为 一 层 ， 里 巧克力 作为 最 后 一 野 . 


3. 如 何 用 整 群 抽样 解决 这 个 问题 ? 


整 群 抽样 :将 巧克力 分 为 几 组 ， 笨 一 组 都 必须 相似 。 假定 急 一 金 巧克力 都 相似 ， 则 可 以 取 其 中 一 
全， 热 后 对 这 一 金 中 胸 所 有 巧克力 进行 抽样 . 
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抽取 样本 


加 你 会 如 何 对 曼 帝 糖果 公司 的 超 长 效 口香糖 球 进行 抽样 调查 ?》 糖 球 有 4 种 颜色 ， 都 由 同一 家 工 
习 厂 生产 。 
假定 你 必须 从 零 开 始 进行 抽样 。 
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练习 解答 


你 会 如 何 对 温 帝 糖果 公司 的 超 长 效 口香糖 球 进行 抽样 调查 ? 糖 球 有 4 种 颜色 ， 都 由 同一 家 工 
习 厂 生产 。 


解答 假定 你 必须 从 零 开 始 进 行 抽样 。 


和 目标 总 体 是 最 带 精 果 公 司 拘 全 部 趋 长 放 口 在 糖 妹 ， 抽 样 单位 是 单 硒 糖 妹 ， 至 于 抽样 空间 ， 


编制 一 食 按 编号 排列 的 糖 妹 表 ， 


表 中 说 明 总 体 中 的 态 种 闫 包 的 糖 球 各 有 多 少 料 。 


合用 何 种 抽样 类 型 取决 于 你 拘 诗 观 意 感 ， 
方 该 。 我 们 会 将 精 球 按 颜 色 进 行 划 分， 


后 用 这 些 输 奸 形成 样本 。 


藻 你 用 了 其 他 解决 方法 也 无需 担心 ， 藉 要 是 想 明 白 如 何 让 你 的 调查 最 好 地 代表 总 体 . 


起 体 是 你 所 研究 的 所 有 事件 的 集 


A 
台 o 


样本 是 从 总 体 中 选取 的 相对 较 小 
的 集合 ， 可 用 于 做 出 关于 总 体 本 身 
的 结论 。 


进行 抽样 时 ， 首 先 定义 目标 总 体 ， 
即 要 研究 的 总 体 。 然 后 确定 抽样 单 
位 ， 即 要 抽样 的 对 象 类 型 。 最 后 ， 
拟定 一 个 抽样 空间 ， 即 目标 总 体 中 
的 所 有 抽样 单位 的 列表 。 


如 果 样 本 不 能 代表 目标 总 体 ， 则 这 
个 样本 存在 偏 简 。 


简单 随机 抽样 即 随机 选择 抽样 单位 
并 形成 样本 ， 包 括 重 复 抽样 和 不 重 
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但 我 们 盼 意 选 振 分 层 抽样 ， 因 芍 这 可 能 是 得 出 无 偏 样本 鬼 最 闻 
喜 后 进行 简单 随机 抽样 ,从 四 种 颜色 中 进出 一 定 比 例 鬼 糖 妹 ， 著 


复 抽样 。 简 单 随 机 抽样 的 具体 方式 
包括 抽签 或 使 用 随机 编号 生成 器 。 


分 展 抽 样 即将 总 体 划分 为 几 个 组 ， 
或 者 叫做 几 个 层 ， 组 或 层 中 的 单位 
都 很 相似 ， 每 一 层 都 尽 可 能 与 其 他 
层 不 一 样 。 分 好 层 以 后 ， 就 对 每 一 
层 执行 简单 随机 抽样 。 


整 群 抽 样 即将 总 体 划分 为 几 个 群 ， 
其 中 每 个 群 都 尽量 与 其 他 群 相似 ， 
可 通过 简单 随机 抽样 抽取 几 个 群 ， 
然后 用 这 些 群 中 的 每 一 个 抽样 单位 
形成 样本 。 


系统 抽样 即 选 取 一 个 数字 k， 然 后 
每 到 第 k 个 抽样 单位 就 抽样 一 次 。 





理想 的 情况 是 
盆 这 可 能 天 法 付 诸 实 疯 ,因此 谍 们 用 另 一 个 方法 来 代 替 ， 即 列 出 一 个 表 ， 


县 体 办 法 可 以 未 同 。 


受 帝 糖果 公司 有 了 梯 本 


在 你 的 帮助 下 ， 曼 帝 糖果 公司 采集 到 了 超 长 效 口香糖 球 的 样本 ， 
这 意味 着 不 用 尝 遍 整个 糖 球 总 体 ， 而 是 用 样本 就 可 以 进行 检验 了 。 











太 棒 了 ! 这 就 是 说 
我 们 将 省 时 、 省 钱 、 





嘟 么 接 下 来 做 什么 ? 


我 们 已 经 讲 过 如 何 采集 具有 代表 性 的 样本 ， 可 还 没有 谈 到 如 何 
利用 这 个 样本 。 我 们 知道 ， 一 个 无 偏 样本 与 总 体 具有 相同 的 特 
征 , 但 用 哪 种 方法 分 析 样 本 最 好 呢 ? 


请 接着 往 下 读 ， 下 一 章 将 讲解 具体 做 法 。 
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抽取 样本 
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11 总 体 和 梓 本 的 估计 
+ 进行 预测 ， 


sy 这 么 说 吧 ， 小 伙 子 1 
她 们 都 一 个 样 必 ， 相 一 个 
就 等 于 相 人 多 部 | 






得 样本 而 知 总 体 ， 不 亦 乐平 ? 


若 想 成 为 样本 专家 ， 首 先 要 懂得 如 何 最 有 效 地 利用 到 手 的 样本 一 利用 样本 准确 地 
预测 总 体 ， 并 以 一 定 方式 说 明 预 测 结果 的 可 靠 程度 。 在 本 章 中 ， 我 们 将 讲解 如 何 通 
过 样本 了 解 总 体 ， 以 及 如 何 通 过 总 体 了 解 样本 。 


进入 新 的 篇 章 


利用 样本 进行 估计 


粮 球 口味 到 底 能 持续 多 久 ? 


在 你 的 帮助 下 ， 粤 帝 糖 果 公 司 得 到 了 超 长 效 口香糖 球 的 无 偏 样本 ， 
他 们 对 样本 中 的 每 一 粒 糖 球 进行 测试 ， 得 到 了 关于 样本 糖 球 口味 持 
续 时 间 的 大 量 数据 。 







只 有 一 个 问题 …… 点 帝 精 球 公 司 苗 天 
Ge 





我 未 管 样本 明 口 味 持续 时 间 有 多 久 ， 我 只 管 间 体 
拘 口 味 持续 时 间 有 多 长 ， 那 捍 我 才能 宣 市 我 们 的 
糖 妹 比 别 罕 的 粮 球 嚼 得 久 ， 


Qo 








为 了 让 首席 执行 官 满意 ， 我 们 需要 求 出 曼 帝 糖果 公司 糖 球 总 体 
的 口味 持续 时 间 的 均值 和 方差 。 


下 面 是 我 们 从 样本 采集 到 的 数据 ， 你 觉得 我 们 该 如 何 通 过 这 些 
数据 得 出 总 体 均值 ? 


这 是 焰 闵 局 61.9 62.6 63.3 64.8 65.1 
味 持 续 时 间 .， 一 1 
单位 ， 妇 名 66.4 67.1 67.2 68.7 69.9 


说 ' 动 动 能 


查看 数据 ， 你 会 如 何 使 用 这 些 数据 估计 总 体 的 均值 和 方差 ?你 觉得 估计 结果 的 可 靠 程 
度 如 何 ? 为 什么 ? 
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证 我 们 首先 估计 总 体 均 值 
我 们 如 何 用 糖 球 样 本 的 口味 测试 结果 得 出 糖 球 总 体 的 口味 持续 时 间 均值 ? 


答案 其 实 十 分 直观 。 我 们 假设 样本 糖 球 的 口味 持续 时 间 与 总 体 糖 球 的 
口味 持续 时 间 相 符 ， 也 就 是 说 ， 我 们 求 出 样本 的 均值 ， 然 后 将 样本 均 
值 作为 总 体 均 值 


下 面 这 张 图 显示 了 样本 的 分 布 情况 以 及 可 以 基于 样本 而 期 望 的 总 体 分 
布 情 况 。 你 会 期 望 总 体 的 分 布 与 样本 的 分 布 相 似 ， 那 样 就 能 假设 样本 
均值 数值 和 总 体 均 值 数值 大 致 相同 . 


料 本 与 基体 









你 是 说 禅 李 的 均值 和 总 
体 的 均值 完全 吻合 ? 


不 能 说 这 二 者 完全 吻合 ， 但 这 是 我 们 能 做 出 的 最 好 估计 。 
根据 已 知 的 情况 ， 样 本 均值 是 我 们 能 为 总 体 均 值 做 出 的 
最 好 估计 一- 在 我 们 根据 手头 信息 得 到 的 数值 中 ， 样 本 
均值 是 最 有 可 能 被 作为 总 体 均 值 的 数值 

样本 均值 被 称 为 总 体 均 值 的 点 估计 量 ， 也 就 是 说 ， 作 


为 一 个 基于 样本 数据 的 计算 结果 ， 它 给 出 了 总 体 均 值 
的 良好 估计 。 


a 总 体 和 样 革 


吉林 -3 | 的 # 均值 大 致 相同 . 
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进行 预测 


点 估计 和 量 详解 


点 估计 量 可 以 近似 总 体 和 参数 


在 此 之 前 , 我 们 用 到 过 一 些 总 体 参数 的 实际 值 ， 如 均值 h. ,或 方差 o*。 我 
们 要 么 能 够 自己 动手 算出 这 些 数 值 ， 要 么 已 经 知道 这 些 数 值 是 多 少 。 


而 这 一 次 ， 我 们 不 知道 总 体 参数 的 确切 数值 。 我 们 无 法 通过 总 体 计算 这 些 
参数 ， 而 只 能 通过 样本 数据 估计 这 些 参 数 。 于 是 ， 我 们 用 “点 估计 量 ” 对 
总 体 参 数 进 行 最 接近 的 猜测 。 

一 个 总 体 参数 的 点 估计 量 就 是 可 用 于 估计 总 体 参 数 数值 的 某 个 函数 或 算式 ， 
例如 ， 由 于 我 们 能 用 样本 均值 估计 总 体 均 值 ， 因 此 样本 均值 就 是 总 体 均 值 
的 点 估计 量 。 





我 们 用 符号 ^ 区 别 实际 总 体 参 数 和 它 的 点 估计 量 , 例如 : 用 符号 表示 总 
体 均值 ， 而 用 FF 表示 样本 均值 ， 即 ， 为 了 指出 你 正在 使 用 的 是 某 一 个 总 体 
参数 的 点 佑 计量， 则 在 该 总 体 参数 的 符号 上 方 标 上 ^。 












看 到 这 顶 帼 子 了 蚂 ? 这 表 
和 示 我 是 一 个 点 估计 量 。 要 是 
你 球 法 得 和 到 确切 的 场 值 ， 我 
就 是 最 好 上 拘 候 科 。 


我 是 总 体 声 值 ， 正 宁 的 。 


除了 顶 上 点 组 了 一 个 人 符号、 这 
个 点 估计 量 伊 扣 就 是 均值 洽 身 ， 
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进行 预测 














我 想起 来 了 ， 总 体 场 值 有 一 个 
表示 符号 ， 总 体 均 值 鬼 点 估计 量 
也 有 一 个 .那么 样 李 场 值 有 表示 
符号 吗 ? 


样本 均值 有 一 个 简 记 符 。 

符号 由 具有 十 分 精确 的 含义 一 总 体 的 均值 。 为 了 不 至 于 混淆 ， 样 本 均 
值 男 有 一 种 表示 方法 : x ( 读 作 “x 拔 ”) 。 这 样 一 来 ， 当 别人 说 到 
时 ,我 们 就 知道 是 指 总 体 均值 ; 说 到 x 时 ， 就 知道 是 指 样本 均值 。 


x 是 的 样本 对 等 量 ， 它 的 计算 方法 和 总 体 均 值 的 计算 方法 一 样 一 将 
样本 中 的 所 有 数据 加 起 来 ， 除 以 总 数 。 即 ， 如 果 样 本 大 小 为 n， 则 : 


将 样 厅 中 的 数字 相 加 ， 站 


x 是 样 直 入 时 三 一 一 

的 均值 ， n 
我 们 可 以 根据 上 式 写 出 总 体 的 点 估计 量 的 简明 表达 式 ， 由 于 可 以 用 样本 
均值 估计 总 体 均 值 ， 因 此 : 


我 们 估计 总 体 场 值 .…… —>p = 所 用 的 是 样 村 均值 






61.9 62.6 63.3 64.8 65.1 66.4 67.1 67.2 68.7 69.9 


使 用 样本 数据 估计 总 体 均值 的 数值 。 提 示 数 据 如 下 : 
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_。 动 动 荡 
人 解 管 











= 657/10 


= 65.7 


夫 : 均值 就 是 均值 ， 怎么 用 这 么 
多 符号 来 表示 ? 


答 ;用 到 的 概念 有 三 个 : 总 体 
均值 、 样 本 均值 以 及 总 体 均值 的 点 
估计 重 。 


总 体 均 值 用 表示， 本 书 前 面 一 直 
在 讲 的 就 是 这 种 均值 ， 其 计算 方法 
是 : 将 总 体 中 的 所 有 数据 相 加 ， 然 
后 除 以 数据 个 数 之 和 。 


样本 均值 用 ?表示 ， 计 算 方 法 同 凡 ， 
不 过 这 时 用 的 是 样本 中 的 数据 。 久 的 
算法 是 : 将 样本 中 的 所 有 数据 相 加 ， 
然后 除 以 祥 本 个 数 之 和 。 


点 估计 本 用 秒表 示 ， 它 其 实 是 根据 样 
本 数据 得 出 的 对 你 所 认为 的 总 体 均 
值 的 最 住 猜测 值 。 
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61.9 62.6 63.3 64.8 65.1 66.4 67.1 67.2 68.7 69.9 
我 们 可 以 通过 计算 样本 均 馆 估计 总 体 坊 舍 : 


61.9 + 62.6 + 63.3 + 64.8 + 65.1 + 66.4++ 67,1 + 67.2 + 68.7 + 69.9 
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世上 没有 俐 问题 


阅 : 这 是 不 是 意味 着 我 们 只 要 算 
出 样本 均值 就 能 求 出 p? 


签 ;我们 无 法 通过 样本 求 出 
的 确切 数值 ， 不 过 ， 只 要 样本 是 无 
偏 的 ， 就 能 得 出 十 分 捉 近 的 估计 值 。 
即 ， 我 们 可 以 利用 样本 数据 求 出 让 ， 
但 无 法 未 出 几 本 身 的 真 值 。 


问 ; ”如 果 样 本 是 有 偏 的 会 怎么 
样 ? 如 何 计算 b 的 估计 值 ? 


答 : 尽量 让 样本 无 偏 的 重要 性 就 
体现 在 这 里 。 如 果 你 手头 的 数据 部 
来 自 样本 ， 那 么 就 要 将 样本 作为 信 
计 基 础 。 如 果 料 本 有 偏 ， 就 意味 着 
的 估计 值 有 可 能 不 准确 ， 有 可 能 因 
此 做 出 错误 的 估计 。 


使 用 样本 数据 估计 总 体 均 值 的 数值 。 提 示 数 据 如 下 : 






阅 :样本 的 大 小 有 影响 吗 ? 


答 : 一 般 说 来 ， 样 本 越 大 ， 点 佑 
计量 越 准确 。 


hb 是 总体 多 值 ，X 是 样 
本 均值 ，1 是 b 的 点 估 
计量 。 
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点 估计 量 由 样本 数据 得 出 ， 是 对 总 体 参 数 的 估计 。 @ ”通过 计算 可 得 到 总 体 均值 的 点 估计 醒 ， 即 


在 讨论 总 体 参数 的 点 佑 计量 时 ， 会 为 总 体 参数 添上 p= 
一 个 ^ 符 号 。 例 如 上 的 点 估计 量 写 作证。 


、 so 民 这 说 明 ， 如 果 想 十 分 近似 地 估计 总 体 均值 的 真 值 ， 
计量 样本 的 均值 用 x 表示 ， 样 本 的 均值 可 用 下 列 公 可 以 使 用 样本 均 信 。 


其 中 x 代表 各 个 样本 的 数值 ，n 为 样本 的 个 数 。 







看 上 去 很 棒 ! 我 们 可 以 把 你 罗 工 作成 
录用 到 电视 广告 里 ， 让 文 家 知道 我 们 揭 
口 看 精 球 能 有 江 有 了 味 地 唱和 多 久 ， 竟 争 对 手 
将 饮 首 称 区 ,这 毫 无 疑问 ,只 中 一 个 同 
题 : 你 期 所 出 瑰 和 多 大 的 方差? 








你 已 经 得 到 了 总 体 均值 的 良好 估计 ， 那 么 方 
着 也 ? 

只 要 我 们 得 出 总 体 方差 的 良好 估计 ， 首 席 执行 官 
就 能 根据 样本 数据 的 结果 ， 判 断 糖 球 总 体 的 口 
味 持续 时 间 有 可 能 出 现 多 大 变异 。 
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总 体 方差 的 点 估计 午 


让 我 们 估计 总 体 方差 


前 面 讲 到 如 何 利用 样本 均值 估计 总 体 均 值 ， 也 就 是 说 ,我 们 为 超 长 效 
口香糖 球 总 体 找到 了 一 个 估计 口味 持续 时 间 均 值 的 办 法 


为 了 让 曼 帝 糖果 公司 首席 执行 官 感 到 满意 ， 我 们 还 需要 得 出 总 体 方差 
的 良好 估计 


我 们 可 以 把 哪个 算式 当 作 总 体 方差 的 点 估计 量 呢 ? 即 ， 我 们 该 如 何 利 
用 样本 数据 求 出 62? 
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这 容易 ， 样 地 方差 必定 等 于 总 
体 方 卷 。 我们 可 以 用 样本 方 卷 


估计 总 体 方 卷 。 





样本 数据 的 方差 可 能 不 是 总 体 方差 的 最 好 估计 办 法 

你 已 经 知道 ， 一 个 数据 集 的 方差 所 量度 的 是 数值 与 均值 的 偏离 程度 
当 你 选择 一 个 样本 后 ， 相 比 总 体 ， 你 拥有 的 数值 数量 变 少 了 ， 因 此 ， 
与 总 体 中 的 数值 偏离 均值 的 程度 相 比 ， 样 本 中 的 数值 更 有 可 能 以 更 紧 
密 的 方式 聚集 在 均值 周围 一 极端 数值 出 现在 样本 中 的 可 能 性 下 降 
这 是 因为 总 的 来 说 这 样 的 数值 变 少 了 


料 本 与 总 体 


频 
芝 体 $y 人 
# : 
FA 
/ : AN 样 林 数量 较 轧 体 几 ， 
Pen 上 _ 
天 了 册 此 ， 很 有 可 铝 把 
‘ 天 SN 一 教 为 极端 的 数值 可 
本 样 共 NM AAA 除 在 外 ， 
wi ww Wa 
口味 持续 时 间 


那么 哪个 算式 能 更 好 算出 总 体 方差 的 估计 值 呢 ? 


我 们 需要 一 个 有 别 于 样本 方差 的 点 估计 量 
用 样本 方差 估计 总 体 方差 会 出 现 这 样 的 问题 :估计 结果 会 稍微 偏 低 一 样 
本 方差 可 能 会 略 小 于 总 体 方差 ， 差 别 程度 则 取决 于 样本 数值 的 大 小 。 样 本 
较 小 时 ， 样 本 方差 与 总 体 方差 的 差别 有 可 能 更 大 

我 们 需要 找到 一 个 更 好 的 办 法 来 估计 总 体 方差 一 找到 样本 数据 的 某 个 机 
数 ， 而 这 个 函数 所 得 出 的 结果 要 稍微 大 于 所 有 样本 数值 的 方差 


那么 同 哪个 算 式 作为 估计 量 ? 


我 们 不 使 用 样本 数据 的 方差 ， 而 用 其 他 方式 估计 总 体 方差 。 如 果 样 本 大 小 
为 n， 可 以 用 下 列 算 式 估计 总 体 方差 : 


es 用 样 二 中 的 每 一 个 数值 减 去 样本 均值 ， 所 
^， E(x - Xx) 得 之 差 取 平方 数 ， 然 后 将 所 有 平方 值 相 加 . 


总 体 方 基 信 计量 一 > 上 = 信 专 一 除 以 样 本 大 小 减 1 
即 ， 取 样本 中 的 每 一 个 数值 ， 减 去 样本 均值 ， 所 得 之 差 取 平方 数 ; 然后 将 


所 有 平方 值 加 起 来 ， 除 以 样本 数 减 1。 这 个 算法 与 样本 方差 的 算法 相似 ， 不 
过 除数 是 n -1， 而 不 是 n。 







为 什么 说 这 是 一 
个 更 好 的 估计 呢 ? 





这 个 公式 与 总 体 方差 的 数值 更 接近 。 

一 组 数字 除 以 n -1 的 结果 大 于 这 一 组 数字 除 以 n 的 结果 ， 当 n 相 
当 小 时 ， 这 种 差别 最 为 显著 。 也 就 是 说 ， 通 过 公式 算得 的 结果 
与 样本 数据 的 方差 近似 ， 但 会 略微 偏 大 。 

总 体 方差 往往 大 于 样本 数据 的 方差 .因此 ， 用 这 个 公式 作为 总 
体 方差 的 点 估计 量 , 效果 更 好 一 点 儿 . 
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进行 预测 


方差 细 细 看 


Dy 三 莽 细 细 澳 


要 想 知道 用 哪个 公式 求 方差 ， 很 需要 费 点 思量 。 一 个 是 求 总 体 方差 c? 的 
公式 ， 一 个 是 略 有 变化 的 求 总 体 方差 点 估计 量 s? 的 公式 ， 什 么 时 候 用 这 
个 ? 什么 时 候 用 那个 ? 



















求 总 体 方 着 
如 果 想 求 确切 的 总 体 方 差 ， 且 拥有 全 部 总 体 数 据 ， 则 可 用 下 式 进行 计算 : 
E(x N b): 人 一 筷 体 均值 

hn 所 一 一 总 体 大 小 


在 这 种 情况 下 : 你 拥有 所 有 总 体 数据 ; 你 知道 总 体 均值 ; 你 想 求 出 所 有 
这 些 数值 的 方差 一 这 正 是 前 面 一 直 在 用 的 计算 方法 。 


估计 总 何方 惰 
如 果 需 要 用 样本 数据 估计 总 体 方差 ， 则 可 用 下 式 进行 计算 : 


总 体态 用 一 落 ?号 








实 众 雯 傍 
Ry A WN 是 样本 的 
基于 样 浴 给 总 = 是 m- T， 而 处 是 w，w 
上 式 不 是 在 “计算 ”有 n 个 数值 的 实际 总 体 的 方差 ， 而 是 根据 所 拥有 的 
样本 数 奖 来 “估计 ”总 体 方差 。 为 了 估计 得 更 准确 一 些 ， 除 数 用 了 n-1， 
而 不 是 n， 这 样 就 能 得 出 略 大 一 点 儿 的 结果 。 


总 体 方差 点 估计 量 的 式 子 通常 写作 s*， 由 此 得 到 : 








几 i 答 出 了 基于 鬼 
A E(x -Kx. 
总 体 方才 的 7 G2 二 S2 其 中 证 一 二 an 汪 

点 估计 量 n-4 





这 种 表示 方法 类 似 于 用 x 表示 样本 均值 。 
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哪个 公式 用 在 哪里 ? 


是 用 n 做 除数 求 方差 还 是 用 n-1 做 除数 求 方差 ? 这 个 问题 
有 时 候 真 是 让 人 悉 肠 百 结 。 做 出 判断 的 黄金 准则 是 : 用 n 
做 除数 会 得 出 “手头 拥有 的 一 组 数据 的 实际 方差 ”。 


如 果 手 头 拥 有 整个 总 体 的 数据 ， 则 以 n 为 除数 会 得 出 总 体 
的 实际 方差 一 需要 所 用 og? 的 公式 ， 除 数 为 n。 


如 果 手 头 拥 有 总 体 的 一 个 样本 的 数据 ， 则 你 可 能 会 希望 用 
这 个 样本 估计 总 体 方差 一 需要 使 用 s: 公 式 ， 除 数 为 n - 1。 


忆 魏 贸 苍 








下 面 是 受 帝 糖果 的 样本 数据 。 
请 你 估计 ， 总 体 方差 是 多 少 ? 
61.9 62.6 63.3 64.8 65.1 66.4 67.1 67.2 68.7 69.9 
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ss 


有 些 书 上 说 计算 样本 时 用 
n-1， 有 些 书 则 说 用 n。 


小 心 ) 


这 是 因为 每 一 本 书 对 样本 的 用 

: 途 作 了 不 同 的 假设 ， 如 果 要 用 样本 估计 总 

: 体 方差 ， 则 要 除 以 n-1。 只 有 在 需要 计算 一 
组 确切 数值 的 方差 时 ， 才 除 以 n。 


如 果 你 正在 参加 统计 学 考试 ， 请 问 清 考试 
委员 会 指定 的 方法 。 
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更 多 解答 ， 香 多 提问 


解 带 下 面 是 曼 帝 糖果 样本 的 数据 。 
请 你 估计 ， 总 体 方差 是 多 少 ? 
61.9 62.6 63.3 64.8 65.1 66.4 67.1 67.2 68.7 69.9 
我 们 可 以 通过 计算 s: 估 计 总 体 方 要， 
人 
Bk x 


WW 了 














(3.8)2 + (3.1 十 (2.4)z 十 (-0.9)2 + (- 0.6)? + (0.7)* 4 (1.4)2 + (1.5)?7 + (3)* 十 (4.2)? 


9 






14.44 + 9.61 二 5,.76 二 0.81 十 0,36 十 0.49 十 1.96 十 2.25 十 9+ 17.64 









9 







三 62.32/9 


= 6.92 (保留 网 位 小 数 ) 


世上 没有 盆 问 题 


问 ; ”为 什么 计算 样本 方差 要 除 以 问 ; ”这 有 数学 依据 吗 ? 问 ; ”能 像 求 方差 的 点 估计 量 一 样 
n-1? 为 什么 不 能 除 以 n? 求 出 标准 差 的 点 估计 量 吗 ”怎么 做 ? 


签 : 有 有 柯 ， 我 们 会 在 本 章 末尾 
签 : 这 是 因为 ， 在 大 部 分 清 况 下 “ 讲 到 这 一 点 。 能 起 到 这 一 点 很 不 错 ， 乱 : 为 了 估计 标准 差 ， 首 先 要 计 
都 是 用 样本 数据 估计 总 体 方差 。 除 ”请 继续 保持 。 算 方差 的 估计 量 ， 标 准 差 的 估计 量 等 
以 nm-1 比 除 以 nD 能 得 出 精确 性 稍微 、 于 方差 估计 量 的 平方 报 。 
高 一 点 儿 的 结果 ， 因 为 样本 数值 的 问 : 我 该 如 何 记 住 哪个 符号 用 于 
方差 很 可 能 略 小 于 总 体 方差 。 总 体 ， 哪 个 符号 用 于 样本 ? 


签 :一 服 说 来 ， 希 腊 字 母 用 于 表 


示 总 体 参 数 ， 而 普通 罗马 字母 用 于 表 
示 样 本 的 均值 和 方差 。 
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受 帝 糖果 公司 抽取 了 更 多 样本 


口味 测试 结果 让 曼 帝 糖果 公司 首席 执行 官 大 受 鼓 舞 ， 他 要 求 再 进行 一 次 抽 
样 ， 以 便 发 布 电视 广告 。 这 一 次 ， 首席 执 行 官 希望 能 够 宣传 曼 帝 糖果 公司 
的 产品 相 比 苑 争 对 手 的 产品 有 多 么 受 欢 迎 

曼 帝 糖果 公司 的 职员 随机 抽取 了 一 些 人 ， 问 他 们 是 喜欢 曼 帝 公司 生产 的 口 
香 糖 球 还 是 喜欢 曼 帝 公司 将 争 对 手 生 产 的 口香糖 球 。 职 员 们 和 希望 能 够 利用 
调查 结果 预测 : 总 体 中 有 多 大 比例 的 人 “可 能 偏爱 曼 帝 公司 的 糖 球 ” 










我 会 选择 显 帝 公司 
的 口香糖 球 ， 未 选 






噢 | 这 些 糖 球 真 悉 
心 人 ， 






| 

[有 
曼 帝 糖 果 公 司 发 现 ， 在 40 个 人 中 有 32 个 人 偏爱 他 们 的 口香糖 球 ， 其 余 8 
个 人 则 偏爱 竞争 对 手 的 口香糖 球 


(CX) 
下 动 泌 及 
ni 
你 会 如 何 求 出 样本 中 偏爱 曼 帝 糖果 口香糖 球 的 人 所 占 的 比例 ?你 认为 这 符合 哪 种 分 布 ? 
如 何 将 求 得 的 结果 用 于 总 体 ? 
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总 体 的 点 估计 败 


过 是 一 个 比 例 问题 


对 于 曼 帝 糖果 的 最 新 抽样 ， 首 席 执行 官 感 兴趣 的 是 ， 是 否 人 人 都 偏爱 曼 
帝 糖果 的 产品 ， 而 不 是 偏爱 竞争 对 手 的 产品 。 也 就 是 说 ， 可 以 将 偏爱 曼 
帝 糖 果 的 每 一 个 人 作为 一 个 “成 功 ”事件 。 


那么 我 们 如 何 利用 样本 数据 预测 总 体 的 “成 功 ” 比 例 ? 


预测 总 体 比 例 


如 果 我 们 用 X 表 示 总 体 的 成 功 事 件数 量 ， 则 X 符 合 二 项 分 布 ， 参 数 为 n 和 
Po n 为 总 体 中 的 人 数 4 p 为 成 功 事件 的 比例 。 


就 像 总 体 均值 的 最 接近 估计 是 样本 均值 一 样 ， 总 体 成 功 比例 的 最 接近 猜 
测 肯 定 是 样本 成 功 比 例 。 即 ， 如 梨 我 们 求 出 样本 中 偏爱 曼 帝 糖果 的 人 的 
比例 ， 就 能 十 分 近似 地 估计 出 总 体 人 群 中 偏爱 曼 帝 糖果 的 人 的 比例 。 


用 偏爱 曼 帝 糖果 的 总 人 数 除 以 样本 总 人 数 ， 就 能 得 出 样本 的 成 功 比例 ; 
如 果 用 P, 代 表 样 本 的 成 功 比例 ， 则 可 以 下 式 估计 总 体 的 成 功 比例 : 


功 比 全 
总 体 成 功 比 例 的 点 估计 量 一 8= p ER 
名 


其 中 


_ 成 功 数目 
P。 “样本 数目 


也 就 是 说 ， 我 们 将 样本 成 功 比例 作为 总 体 成 功 比例 的 点 估计 量 ， 在 明帝 
糖果 的 最 新 抽样 中 ，40 个 人 中 有 32 个 人 偏爱 曼 帝 糖果 产品 ， 因 此 p。= 0.8。 
于 是 。 总体 成 功 比 例 的 点 估计 量 也 是 0.8。 
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进行 预测 










这 么 说 我 认为 概率 和 比例 五 有 关系 
是 对 的 ? 它们 都 用 Pp 表示 ， 而 且 十 分 
相似 。 


概率 和 上 比例 互 有 关系 
其 实 ， 概 率 和 比例 有 很 密切 的 关系 


假设 你 有 一 个 总 体 ， 需 要 求 其 成 功 比例 。 为 此 ， 你 可 用 成 功 的 数 
目 除 以 总 体 大 小 。 

现在 ， 假 设 你 想 计 算 从 总 体 中 随机 选取 一 个 成 功 事件 的 概率 。 为 
此 ， 你 可 用 总 体 的 成 功 数目 除 以 总 体 大 小 。 可 以 看 出 ， 你 计算 成 
功 概率 的 方法 和 计算 成 功 比 例 的 方法 完全 一 样 ， 

我 们 用 字母 p 代 表 总 体 的 成 功 概率 ， 我 们 也 能 方便 地 用 p 代 表 比 
例 一 - 二 者 数值 相同 。 





p = probability (概率 ) = proportion (比例 ) 


曼 帝 糖果 公司 为 超 长 效 口香糖 球 取得 了 另 一 个 样本 ， 并 发 现 ， 
在 样本 中 ，40 个 人 中 有 10 个 人 偏爱 粉色 口香糖 球 ， 这 些 人 对 其 
他 颜色 不 那么 喜欢 。 总 体 中 偏爱 粉色 糖 球 的 人 的 比例 是 多 少 ? 
从 总 体 中 选中 一 个 不 偏爱 粉色 糖 球 的 人 的 概率 是 多 少 ? 
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晏 帝 糖果 公司 为 超 长 效 口香糖 球 取得 了 另 一 个 样本 ， 并 发 现 ， 
在 样本 中 ，40 个 人 中 有 10 个 人 偏爱 粉色 口香糖 球 ， 这 些 人 对 其 
他 颜色 不 那么 喜欢 。 总 体 中 偏爱 粉色 糖 球 的 人 的 比例 是 多 少 ? 
从 总 体 中 选中 一 个 不 偏爱 粉色 糖 球 的 人 的 概率 是 多 少 ? 


我 们 可 咏 利 用 祥 本 比例 估计 总 体 比例 ， 即 ， 


人 ~ 
让 = 下 = 10/40 


一 0.25 


从 总 体 中 过 中 一 个 未 喜欢 粉色 精 妹 的 人 的 概率 : 


P( 未 偏 过 将 色 ) = 1 -个 


=1-0.25 


= 0.75 


浆 ， 这 么 说 比例 和 概率 是 一 回 事 ? 


人 答 : 总 体 的 成 功 数目 除 以 总 体 大 
小 即 等 于 比例 ， 这 个 算法 和 用 于 计算 
二 项 分 布 的 概率 的 算法 是 一 样 的 。 


奖 : ”比例 算法 仅 适用 于 二 项 分 布 
吗 ? 是 否 适 用 于 其 他 概率 分 布 ? 


签 :在 我 们 讲 过 的 所 有 概率 分 布 
中 ， 二 项 分 布 是 唯一 与 比例 有 关 的 分 
布 。 比 例 算 法 专门 用 于 解决 这 种 分 布 
的 问题 。 
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世上 没有 俐 问题 


阅 : 样本 比例 与 总 体 比 例 一 样 
吗 ? 


签 ; 样本 比例 可 以 作为 总 体 比 例 
的 点 信 计 重 ， 其实， 样本 比例 是 对 
总 体 比 例 的 具体 数值 的 最 好 狂 测 。 


阅 : 如果 样 本 存在 偏 信 ， 还 会 这 
样 吗 ? 如 何 通过 一 个 有 偏 样本 估计 
比例 ? 


答 :关键 在 于 确保 祥 本 无 偏 ， 因 
为 祥 本 是 估计 的 依据 。 如 果 样 本 有 
偏 ， 那 么 就 会 得 出 对 总 体 比 例 的 不 
准确 估计 。 其 他 点 估计 量 也 会 有 这 
种 情况 。 





阅 : ”那么 如 何 确保 样本 无 偏 呢 ? 


答 ; 请 复习 前 面 章节 讲 过 的 要 
点 ,遵守 这 些 要 点 是 确保 样本 尽量 具 
有 代表 性 的 好 办 法 。 多 花 点 力气 准 
备 样 本 是 值得 的 ， 这 意味 着 你 的 点 
估计 量 能 够 更 精确 地 反映 总 体 本 身 。 
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将 极 了 ! 
我 们 得 到 了 大 量 上 好 
用 的 重 计 量 ， 可 以 
好 好 全 广 告 了 。 





四 ”总 体 方差 的 点 估计 是 如 下 : P 的 点 估计 量 为 p.， 其 中 p. 为 样本 的 成 功 
比例 。 


52= Ss? 
其 中 sz 的 算法 为 : Cs 
z(x -7 p. 的 计算 方法 是 :用 样本 中 的 成 功 数目 除 

nn- 1 以 样本 数目 9 


@。 总体 比 例 用 p 玫 示 ， 即 总 体 的 成 功 比例 。 _ 成 功 数目 
Rs 样本 数目 
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求解 样本 概率 


快 来 这 儿 吴 糖 球 ! 


还 记得 统计 邦 电影 院 吗 ”他 们 最 近 获 得 特许 ， 可 以 销售 曼 帝 糖 
果 ， 这 个 动向 证 明 很 多 顾客 都 喜欢 曼 帝 糖果 公司 的 糖 球 。 


问题 是 ， 并 非 人 人 都 开心 。 


我 就 爱 吃 红 色 糖 球 ， 其 他 颜 


色 的 都 不 爱 吃 . 人 金子 里 有 几 Q 
颗 红 色 糖 妹 ? 





引进 大 会 装 糖 球 

电影 院 出 售 混合 型 盒 装 糖 球 ; 还 有 ， 这 个 周末 他 们 将 播 出 一 系 
列 经 典 老 片 。 

这 次 活动 看 来 很 受 欢迎 ， 出 票 情 况 很 好 。 问 题 是 ， 有 的 人 要 
是 吃 不 到 自己 喜欢 的 红色 糖 球 就 会 大 失 所 望 。 

一 盒 大 包装 糖 球 可 供 数 人 分 享 ， 每 一 盒 装 有 100 粒 糖 球 ， 糖 球 
总 体 中 有 25% 是 红色 的 。 











我 要 嚼 40 颗 糖 妹 才能 看 完 
整 场 电影 ， 我 有 可 能 品 愿 
吗 ? 屿 果 包 装 鲍 里 没有 足够 
多 的 红色 糖 球 ， 我 就 改 吃 别 
的 零食 . 


我 们 需要 求 一 大 盒 特定 糖 球 中 有 40 颗 或 40 颗 以 上 红 
色 糖 球 的 概率 。 

由 于 每 一 大 盒 糖 球 的 容量 为 100 颗 ， 也 就 是 说 我 们 要 求 出 
在 一 大 盒 特定 糖 球 中 红色 糖 球 占 40% 的 概率 ， 且 已 知 糖 球 
总 体 的 25% 是 红色 的 。 
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近 和 抽样 有 什么 关系 ? 


前 面 已 经 讲 过 如 何 得 到 无 偏 样本 ,以 及 如 何 利用 样本 求 出 总 体 参数 
的 点 估计 量 。 


这 一 次 ,情况 有 所 不 同一 总 体 参 数 已 知 ， 需 要 为 某 一 盒 特定 糖 球 
计算 概率 。 也 就 是 说 ， 在 这 里 要 算 的 不 是 总 体 的 概率 ， 而 是 样本 比 
例 的 概率 。 










以 前 未 是 磁 到 过 这 种 问题 
蚂 ? 有 什么 大 不 了 的 ? 


这 一 次 我 们 需要 为 样本 计算 概率 ， 而 不 是 为 总 体 计算 概 率 。 


我 们 并 不 计算 取得 概率 分 布 中 的 某 个 特定 频数 或 特定 数值 的 概率 ， 
而 是 要 计算 样本 比例 本 身 的 概率 一 我们 要 算出 在 一 个 整体 中 出 现 一 
种 特定 比例 的 概率 。 


为 了 能 够 计算 上 述 概率 ， 我 们 先 要 得 出 样本 比例 的 概率 分 布 ， 下 面 
是 具体 做 法 : 





个 查看 与 我 们 的 特定 样本 大 小 相同 的 所 有 样本 。 
如 果 我 们 有 一 个 大 小 为 n 的 样本 ， 就 需要 考虑 所 有 大 小 为 n 的 可 能 样 
本 。 在 本 例 中 ,盒子 里 的 精 球 数量 为 100， 因 此 n 为 100。 


@ 观察 所 有 样本 比例 形成 的 分 布 ， 然 后 求 出 比例 的 期 望 和 方 整 。 
每 一 个 样本 都 有 自己 的 情况 .因此 每 个 包装 盒 里 的 红色 糖 球 的 比例 都 
有 可 能 发 生变 化 。 


和 。 得 出 上 述 比例 的 分 布 后 ， 利 用 该 分 布 求 出 概率 。 
得 知 一 个 样本 中 的 “成 功 比例 ”的 分 布 后 ， 就 能 够 利用 这 个 分 布 求 出 
一 个 随机 样本 的 比例 概率 一 这 里 的 随机 样本 是 一 大 盒 糖 球 。 


让 我 们 看 看 具体 做 法 。 
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比例 的 抽样 分 布 


比例 的 抽 梓 分 布 
如 何 求 样本 比例 的 分 布 ? 


让 我 们 先 看 糖 球 总 体 。 已 知 总 体 中 的 红色 糖 球 的 比例 ， 用 p 表 示 ， 
即 p=0.25 


糖 球 总 体 粮 球 总 体 明 25% 为 红 
人 全 色 . 国 此 Pp 三 0.25， 





© 
@ ©® © 
CS 8 ©® @ 


每 一 大 盒 糖 球 其 实 就 是 从 糖 球 总 体 中 取出 的 一 个 样本 。 每 一 大 盒 装 有 100 颗 
糖 球 ， 因 此 样本 大 小 为 100， 让 我 们 用 n 表 示 这 个 大 小 











如 果 用 随机 变量 X 代 表 样 本 中 的 红色 糖 球 的 数目 ， 则 X~B(n,p)， 其 中 n=100， 
p = 0.25 


样本 中 的 红色 糖 球 的 比例 取决 于 X 一 一 样本 中 的 红色 糖 球 的 数目 ， 即 比例 本 
身 是 一 个 随机 变量 ， 可 以 将 此 记 为 P。 且 P。 = X/n 


ps 表示 样 村 鬼 记 坊 比 供 ， 


Css 一 人 
© e@ 
Ss ee 


玫 们 系 知 道 样 地 中 的 红 


色 粮 球 的 确切 数目 ， 全 
我 们 知道 它 欣 分 布 ， 


X~B(n, p) 
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可 以 取出 的 大 小 为 n 的 可 能 样本 为 数 众 多 。 每 一 个 可 能 样本 会 包含 n 颗 


糖 球 ， 每 一 盒 样本 中 的 红色 糖 球 的 数量 会 符合 相同 的 分 布 一 对 于 每 一 和 前 面 讲 到 的 样本 


个 样本 ， 红 色 糖 球 的 数量 符合 B(n, p)， 成 功 比例 则 为 X/n 一 样 ， 每 一 个 冬 革 
区 都 包含 w 个 无 素 ， 
@ 全 几 个 不 同 的 样 素 @ 四 全 
es © © 
© © 
© St eee 
©@e Ge 
X~ B(n, p) @ X~B(n, p) 
P. = X/n 合 © © P。 = Xin 
X ~ B(n, p) 
P = X/n 


利用 所 有 可 能 的 样本 ， 我 们 能 得 出 所 有 样本 比例 的 分 布 ， 该 分 布 称 作 “ 比 
例 的 抽样 分 布 ”， 或 者 称 作 “P, 的 分 布 ”。 








明 忽 了 . “比例 的 抽样 分 布 ” 其 实 是 一 种 概 
率 分 布 ， 由 所 有 大 小 为 mw 的 可 能 样本 的 各 种 比 
例 构 成 。 如果 我 们 知道 这 些 比例 的 分 布 ， 就 能 


用 这 个 分 布 尿 出 某 一 个 特定 样本 的 比例 的 发 生 
概率 . 


利用 比例 的 抽样 分 布 ， 能 够 求 出 某 一 个 随机 选择 的 、 大 小 为 
n 的 样本 的 “成 功 比 例 ” 的 概率 。 

也 就 是 说 ,我 们 能 够 利用 比例 的 抽样 分 布 求 出 “ 某 一 大 盒 糖 球 中 
的 红色 糖 球 比例 至 少 为 40%” 的 概率 。 





~ 用 
me 


a 
不 过 ， 在 此 之 前 ， 我 们 需要 知道 上 述 分 布 的 期 望 和 方差 。 g 确 
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P: 的 期 望 和 方差 


P, 的 期 望 是 多 少 ? 


前 面 讲 到 ， 我 们 可 以 通过 所 有 可 能 取 用 的 、 大 小 为 n 的 样本 的 各 个 比例 形成 一 
个 分 布 ， 为 了 能 够 用 这 个 分 布 计算 概 率 ， 我 们 还 需要 了 解 更 多 有 关 这 个 分 布 的 
数据 一 尤其 需要 知道 方差 和 期 望 。 


让 我 们 先 考虑 期 望 。 出 于 直觉 ， 我 们 会 期 望 样本 中 的 红色 糖 球 的 比例 与 总 体 中 
的 红色 糖 球 的 比例 保持 一 致 。 如 果糖 球 总 体 中 包含 25% 的 红色 糖 球 ， 那么 ， 可 
以 期 望 样本 中 也 包含 25% 的 红色 糖 球 。 

区 出 于 直觉 ， 你 会 期 户 @. 


© OO @ 
® 样本 中 的 红色 糖 球 的 | ‘“@e © 
人 人 全 比 例 与 总 体 中 的 红色 > © 全 台 be 


一 


@ -® 、 
; 将 球 的 比 俐 一 并 一 客人 园丁 一 @ © © 
© ee o° 


那么 Ps 的 期 望 是 多 少 ? 


我 们 想 求 E(Ps)， 其 中 Ps = X/n。 也 就 是 说 ， 我 们 想 求 出 所 期 望 的 样本 比例 数值 ， 这 里 的 
样本 比例 等 于 红色 糖 球 的 数量 除 以 样本 糖 球 的 总 数量 ， 即 : 


E(P.) =E1 一 
n 


_ E00 


n 


上 式 中 的 X 为 样本 中 的 红色 糖 球 的 数目 ， 如 果 我 们 把 红色 糖 球 数目 视 为 “成 功 
数目 ”， 则 X ~ B(n, p)。 


在 二 项 分 布 一 章 已 经 讲 过 : E(X) = np， 于 是 : 


一 Wp 


这 个 结果 正好 符合 我 们 直觉 中 的 期 望 。 我 们 可 以 期 望 样 本 的 成 功 比例 与 总 体 的 
成 功 比例 相 一 致 。 
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只 的 方 芝 是 多 少 ? 

为 了 能 够 求 出 任何 样本 比例 的 概率 ， 我 们 还 需要 先知 道 P, 的 方差 一 可 以 
用 求 期 望 的 相似 方法 求 方差 。 

那么 Var(P,) 是 多 少 ? 让 我 们 像 以 前 一 样 ， 从 p。 = XAn 开 始 : 


Var(p.) = Yar 一 
n 


Var(X 
ec 在 杰 例 中 ，& 一 1 


n 





如 上 所 述 ，X 为 样本 中 的 红色 糖 妹 的 数目 。 如 果 我 们 将 红色 糖 球 的 数目 
视 为 “成 功 数目 ” 9 则 X oe Bi(n, p)， 于 是 Var(X) = Npd; 即 二 项 分 布 的 
方差 。 得 到 : 


Var(lX 
VarlP:) = ed. 





n 


Hpq varb9 一 


取 方 差 的 平方 根 ， 可 得 P, 的 标准 差 ， 它 指出 样本 比例 与 p 的 可 能 差距 ， 有 时 
候 我 们 将 它 称 为 “比例 标准 误差 ”， 因 为 它 能 指出 样本 比例 的 可 能 误差 。 


六 
比例 标准 讽 兰 = J 
nn 
n 越 大 ， 比 例 标准 误差 越 小。 也 就 是 说 ,样本 中 包含 的 对 象 越 多 ,用 样本 比 


例 作 为 p 的 估计 量 就 越 可 车。 


现在 ， 如 何 用 所 求 得 的 期 望 和 方差 数值 计算 比例 的 概率 更 ? 让 我 们 接着 进行 
下 去 。 


素 自 于 Var(QX) 二 azsVar(X) ， 
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第 11 章 “总体 和 样本 的 估计 463 


P. 的 分 布 


求解 了 的 分 布 


我 们 在 前 面 求 出 了 P, 一 - 比例 的 抽样 分 布 的 期 望 和 方差 ， 我们 发 现 ， 如 
果 通 过 所 有 样本 比例 形成 一 个 分 布 ， 则 : 


pa 
E(P.) = p Var(P.) = 二 


我 们 可 以 借助 以 上 结果 求 出 “大 小 为 100 的 样本 中 的 红色 糖 球 的 比例 至 少 
为 40%” 的 概率 。 







怎么 求 绝 ? 淮 道 我 们 未 
需要 光 知 道 P. 明 分布? 







没 错 ，P, 的 分 布 实 际 上 取决 于 样本 的 大 小 。 
下 面 是 一 张 P, 的 分 布 图 ， 其 中 n 很 大 。 


明星 = 
CC 








观察 Ps 的 分 布 图 形 ， 这 里 n 很 大 。 你 觉得 Ps 符合 什么 分 布 ? 
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P, 符 合 正 态 分 布 


当 n 很 大 时 ，P, 的 分 布 接近 正 态 分 布 。 所 谓 “ 很 大 ”是 指 大 于 30。n 
越 大 ，P。 的 分 布 越 接近 正 态 分 布 。 


我 们 已 经 求 得 P。 的 期 望 和 方差 ， 也 就 是 说 ， 当 n 很 大 的 时 候 : 


Pan ) 


有 时 候 统计 学 家 对 mn 
应 该 为 多 大 无 法 达 
成 共识 。 





小 心 / 


如 果 你 正 准 备 参 加 统计 学 考 


由 于 在 n>30 的 时 候 P, 符 合 正 态 分 布 ， 所 以 可 以 用 正 态 分 布 解答 我 人 的。 ; 试 ， 一 定 要 问 清楚 考试 委员 会 


糖 球 问题 。 我 们 可 以 用 正 态 分 布 计 算 “ 某 一 大 盒 糖 球 中 的 红色 糖 球 比 。 :; 的 要 求 。 
例 至 少 为 40%” 的 概率 。 


只 是 有 一 件 事 别 忘 了 : 需要 对 抽样 分 布 进行 连续 性 修正 。 


,一 需要 进行 连续 性 修正 


每 个 样本 的 “成 功 数目 ”都 是 离散 的 。 由 于 使 用 “成 功 数 目 ” 计 算 
比例 ， 因 此 在 用 正 态 分 布 计算 概率 时 ， 要 进行 连续 性 修正 。 


我 们 前 面 讲 过 ， 如 果 用 X 表 示 样 本 中 的 成 功 数 目 ， 则 Ps = X/n; X 的 正 
态 连 续 性 修正 为 + (1/2)。 = 








如 果 我 们 用 以 上 数值 替代 公式 P= X/n 中 的 X， 那 么 P, 的 连续 性 修正 为 : 可 以 忽略 连续 性 : 
修正 . : 

土 (1/2) : 

ee : 

et : 随 着 n 增 大 ， 连 续 性 修正 : 

+1 : 变 得 很 小 ， 于 是 对 整个 概 : 

2n : 率 带 来 的 变化 极 小 。 有 些 课本 会 完 : 


: 全 忽略 连续 性 修正 。 
即 ， 如 果 用 正 态 分 布 近似 计算 .的 概率 ， 一 定 要 用 + 1/2n 进 行 连续 
性 修正 ; 连续 性 修正 的 确切 数值 取决 于 数值 n。 
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世上 没有 傻 河 饥 及 获 点 


阅 : 什么 是 抽样 分 布 ? 


签 :， 如 果 从 一 个 总 体 中 用 相同 的 
方法 抽取 许多 大 小 相同 但 存在 差异 
的 样本 ， 然 后 用 每 个 祥 本 的 某 个 属 
性 形成 一 个 分 布 ， 则 所 得 结果 称 为 
抽样 分 布 。 由 此 得 出 ， 用 每 个 样本 
的 比例 形成 的 抽样 分 布 就 是 “比例 
的 抽样 分 布 ”。 


阅 : ”我们 的 确 需要 采集 所 有 可 能 
采集 的 样本 吗 ? 


答 : 不， 其实 我 们 不 用 实际 动手 
采集 所 有 样本 ， 而 是 假设 我 们 采集 了 
所 有 样本 ， 然 后 得 出 期 望 和 方差 的 
表达 式 。 


QO 


名” 考虑 从 同一 个 总 体 中 到 得 的 所 有 大 小 为 "的 可 能 
样本 ， 由 这 些 样本 的 比例 形成 一 个 分 布 ， 这 就 


世上 没有 俐 问题 


阅 : 这 么 说 抽样 分 布 有 期 望 和 方 
差 ? 为 什么 ? 


因此 ， 像 其 他 概率 分 布 一 样 ， 它 有 
期 望 和 方差 。 


比例 的 抽样 分 布 的 期 望 类 羽 于 样本 
比例 的 平均 数 ， 等 于 从 一 个 特定 总 
体 中 取出 的 样本 的 期 望 比例 。 


阅 ; 为 什么 P. 的 方差 和 总 体 方差 
o :不 一 样 ? 


答 :比例 的 抽 祥 分 布 的 方差 描述 
的 是 样本 比例 的 变化 情况 ， 而 不 是 描 
述 数 值 本 身 的 变化 情况 。 由 于 描述 的 
概念 不 一 样 ， 因 此 结果 教 值 不 一 样 。 


式 为 : 


是 “比例 的 抽样 分 布 ”。 我 们 用 p, 代 表 样本 比例 


随机 变量 。 
Ps 的 期 望 和 方差 的 定义 式 是 : 
E(PJ = p 


Var(Ps) = pqin 


其 中 p 为 总 体 比例 。 
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抽样 分 布 是 一 个 概率 分 布 ， 


阅 : 比例 的 抽样 分 布 有 什么 用 处 ? 


答 :可 以 用 它 求 出 从 一 个 已 知 总 
钵 中 取出 的 某 信 样本 的 比例 的 概率， 
可 以 由 此 得 知 样本 的 期 望 形态 。 


阅 :比例 标准 误差 究竟 有 何 含义 2 


签 :标准 误差 是 抽样 分 布 的 方差 
的 平方 根 ， 实 际 上 ， 它 指出 你 能 够 期 
望 的 样本 比例 与 总 体 比例 真 值 的 差 
距 ， 即 指出 你 能 期 望 出 现 哪 种 误差。 





该 分 布 的 标准 差 称 为 比例 标准 误差 ， 其 定义 


VVarlp,) 


日 ”如 果 n > 30， 则 Ps 符合 正 态 分 布 ， 于 是 : 


Pp; ~ N(p, pq/n) 


使 用 这 个 公式 时 需要 进行 连续 性 覆 正 : 





1 


土 一 一 


2n 


进行 预测 
和 糖 球 总 体 的 259% 为 红色 。 在 一 盒 装 有 100 粒 糖 球 的 包装 盒 中 ， 至 少 有 40% 红 色 糖 球 的 概率 


3 有 多 大 ? 让 我 们 逐步 进行 计算 。 
pu 


1. 如 果 Ps 表 示 合 中 的 红色 糖 球 的 比例 ， 那 么 Ps 符合 什么 分 布 ? 


2. P(Ps > 0.4) 的 数值 是 多 少 ? 
提示 ， 别 忘 了 进行 巡 续 性 修正 . 
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练习 解答 


糖 球 总 体 的 25% 为 红色 。 在 一 盒 装 有 100 粒 糖 球 的 包装 盒 中 ， 至 少 有 40% 红 色 糖 球 的 概率 
与 有 多 大 ? 让 我 们 逐步 进行 计算 。 
解答 
1. 如 果 Ps 表 示 盒 中 的 红色 糖 球 的 比例 ， 那 么 Ps 符合 什么 分 布 ? 
让 我 们 用 Pp 表示 金 中 红色 糖 妹 的 概率 。Bhp = 0.25。 
让 我 们 用 P: 表 示人 镶 中 红色 糖 球 的 比例 。 





Ps 一 N(p, PALW)， 其 中 p = 0.25， q 一 0.75， 且 必 一 100。 由 于 Pq[w 等 于 0.25 x 0.75 /100 = 0.001875， 得 到 : 
P; ~ N(0.25, 0.001875) 


2. P(Ps 0.4) 的 数值 是 多 少 ? 提示 : 别 忘 了 进行 连续 性 修正 。 


P(Ps20.4) =P(P: > 0.4- 1/(2 x 100)) 


=P(P, > 0.395) 


由 于 Ps 一 N(0.25, 0.001875) ， 我 们 需要 束 出 0.395 鬼 标准 分 ， 这样 就 能 在 概率 表 中 查找 结果 。 于 是 得 出 : 


0.395 ~ 0.25 
Vo.001 875 


= 3.35 


乙 三 


P(Zz>2z)=1-P(Z < 3.35) 
=1-0.9996 


= 0.0004 


即 一 爹 100 粒 上 装 的 糖 球 中 ， 红 色 粮 球 至 少 为 40% 的 概率 是 0.0004， 










概率 是 0.0004? 算 了 ， 
我 还 是 吃 爆 米 花 吧 ， 
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进行 预测 





比 剑 的 特大 分 布 细 顷 


取 所 有 大 小 为 n 的 可 能 样本 的 比例 ， 形 成 分 布 ， 这 就 是 比例 的 抽样 分 
布 。 一 个 样本 的 成 功 比 例 用 P: 表 示 , 且 : 






当 n 很 大 时 ， 例 如 大 于 30， 则 P. 近 似 为 正 态 分 布 ， 于 是 : 


eo) 


知道 Ps 的 概率 分 布 很 有 用 处 一 这 表明 ， 在 已 知 特定 总 体 的 情况 下 ， 我 们 P 
可 以 计算 样本 的 成 功 比例 的 概率 。 我 们 可 以 用 正 态 分 布 近似 该 分 布 ， 样 本 
越 大 ,近似 结果 越 正确 。 











抽 梯 分 布 的 乏 绪 性 修正 
在 用 正 态 分 布 进行 上 述 近 似 计算 时 ， 进 行 连续 性 修正 十 分 重要 ， 这 是 因为 
样本 中 的 成 功 数目 是 离散 的 ， 进 行 比 例 计算 时 用 到 了 这 个 离散 值 。 


如 果 用 X 代 表 样 本 中 的 成 功 数目 ， 则 Ps;=X/n。X 的 连续 性 修正 为 + (1/2)， 
即 连 续 性 修正 的 算式 为 ; 


















2n 







也 就 是 说 ， 如 果 用 正 态 分 布 近 似 计 算 抽 样 比例 的 概率 ， 一 定 要 用 +1/2n 
进行 连续 性 修正 。 
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样本 均值 的 分 布 


有 多 少 糖 球 ? 


利用 比例 的 抽样 分 布 ， 你 成 功 地 求 出 了 某 一 个 特定 样本 中 出 现 一 定 比 
例 的 成 功 事 件 的 概率 。 这 就 是 说 ， 现 在 你 可 以 用 样本 预测 总 体 情况 ， 
或 是 用 所 了 解 的 总 体 信 息 预 测 样本 情况 。 









佩服 ， 实在 佩服 。 最 后 
再 解决 一 个 问题 就 …… 


又 来 了 一 个 问题 …… 


曼 帝 精 果 公司 还 有 一 个 问题 需要 你 动手 解决 一 除了 大 盒 装 糖 球 ， 拒 
帝 糖果 也 生产 小 袋 装 糖 球 ， 你 可 以 把 小 袋 糖 球 装 在 口袋 里 随身 带 着 ， 
想 吃 就 吃 。 


根据 曼 帝 精 果 公司 对 总 体 的 统计 ， 每 一 个 小 包装 袋 里 的 精 球 数目 均值 
为 10， 方差 为 1。 麻 烦 来 了 : 他 们 遭 到 了 投诉 。 一 位 量 忠 实 的 顾客 买 了 
30 袋 糖 球 ， 结 果 发 现 每 袋 糖 球 中 的 糖 球 平均 数目 只 有 8.5。 


首席 执行 官 担心 失去 最 佳 大 客 ， 于 是 想 给 他 一 些 补偿 ， 问 题 是 他 并 不 
想 补 偿 所 有 顾客 。 他 想 知 道 ， 这 种 事 的 发 生 概率 有 多 大 ? 










{0 动 荔 及 


为 了 解决 这 类 问题 ， 你 需要 知道 什么 数据 ? 
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进行 预测 


我 们 需要 求 样本 均值 的 概率 


这 个 问题 与 前 面 的 问题 略 有 不 同 。 我 们 已 知 小 包装 糖 球 的 总 体 均 
值 和 方差 ,然后 抽取 了 几 袋 糖 球 作为 样本 ， 需 要 为 该 样本 计算 概 
率 。 这 一 次 ， 我们 不 需要 计算 样本 比例 的 概率 ， 而 要 计算 样本 均 
值 的 概率 。 


这 一 次 的 总 体 是 所 
有 小 包装 糖 球 . 








为 了 计算 样本 均值 的 概率 ， 先 要 得 出 样本 均值 的 概率 分 布 。 下 面 是 
具体 步骤 : 


人 @O 。 坦 看 与 我 们 所 研究 的 样本 大 小 相同 的 所 有 可 能 样本 。 
如 果 我 们 手头 的 样本 大 小 为 n， 则 需要 考虑 大 小 为 n 的 所 有 可 能 样本 。 
小 包装 糖 球 有 30 袋 ， 因 此 这 里 的 n 为 30。 


@ 。 查看 所 有 样本 形成 的 分 布 ， 求 出 样本 均值 的 期 绢 和 方差 。 
每 一 个 样本 都 各 有 特点 ， 每 个 包装 袋 中 的 糖 球 数目 有 变化 。 


全 得 知 样本 均值 的 分 布 后 ， 用 该 分 布 求 出 概率 。 
只 要 知道 所 有 可 能 样本 的 均值 的 分 布 情况 ， 就 能 利用 该 分 布 求 出 一 个 
随机 样本 的 均值 的 概率 ， 在 本 例 中 ， 随 机 样本 即 小 包装 糖 球 。 


让 我 们 看 看 如 何 解 决 以 上 问题 。 
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样本 均值 分 布 深 究 


均值 的 抽样 分 布 


我 们 如 何 求 样本 均值 的 分 布 ? 


让 我 们 从 袋 装 糖 球 的 总 体 开始 。 我 们 已 知 总 体 的 均值 和 方差 ， 并 用 此 


和 中 表示， 一 个 包装 袋 中 的 糖 球 数量 可 以 用 X 表 示 。 


随机 选择 的 每 一 袋 糖 球 都 是 X 的 一 个 独立 观察 结果 ， 因 此 ， 每 一 袋 糖 球 
都 符合 相同 的 分 布 。 即 ， 如 果 用 X. 代 表 随 机 选择 的 一 袋 糖 球 中 的 糖 球 


数量 ， 则 每 个 X, 的 期 望都 是 上 ， 方 差 都 是 o?。 


娘 之 
a x 代 天 一 案 净 
Mpx /a 


E(X) = b 


Var(X) = o? IE 


现在 ， 让 我 们 取 n 包 糖 球 作为 样本 ， 我 们 可 以 标记 从 X; 到 X, 的 包装 袋 中 
的 糖 球 数 量 ， 每 个 Xi 都 是 X 的 一 个 独立 观察 结果 ， 于 是 它们 遵守 相同 的 


分 布 ; 每 一 个 Xi; 的 期 望都 是 上 ， 方 差 都 是 o?。 


我 们 可 以 用 X 表 示 这 n 袋 糖 球 的 容量 均值 ，X 的 数值 取决 于 n 袋 糖 球 中 的 
每 一 袋 糖 球 的 容量 ， 计 算 时 ， 要 将 所 有 糖 球 的 数量 加 起 来 ， 再 除 以 n。 


X 的 样本 






X, XX, 

E(X;) = bp E(X,) = hb 

Var(X)=o Var(X)= oz 
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每 个 X: 都 是 X 的 一 个 独立 


CC 观察 舍 果 ， 轩 此 每 一 上 


球 中 的 糖 球 数量 都 有 相同 
的 期 望 和 方 益 。 


RE 


X + X + … 了 六 


X = 


x Wa 


E(X) = b 


Var(X) = o? 


乱 一 袋 糖 球 中 的 糖 球 
数量 符合 相同 的 分 布 。 


各 个 包 里 
为 数 ， 


进行 预测 


可 以 取出 的 大 小 为 n 的 可 能 样本 为 数 众多 。 每 一 个 可 能 样本 都 包含 n 袋 糖 
球 ， 即 每 一 个 样本 都 包含 X 的 n 个 独立 观察 结果 ; 每 一 个 随机 选择 的 包装 
中 的 糖 球 数量 都 遵守 相同 的 正 态 分 布 ; 我 们 以 相同 的 方法 计算 每 一 个 样 
本 的 糖 球 数量 均值 。 乱 一 个 衬 夺 都 包含 






X 的 样本 


Ey 





这 是 这 个 样本 中 次 每 一 
党 粮 球 鬼 糖 球 数 目 均 值 ， 
我 们 可 以 利用 从 所 有 可 能 样本 得 出 的 所 有 样本 均值 形成 一 个 分 布 ， 叫 
做 “均值 的 抽样 分 布 ”， 或 叫做 X 的 分 布 。 





这 确实 对 我 们 有 帮助 吗 ? 
这 能 告诉 我 们 什么 ? 


均值 的 抽样 分 布 为 我 们 提供 了 一 种 计算 样本 均值 的 概率 的 方法 。 
为 了 计算 任何 一 个 变量 的 概率 ， 先 要 知道 这 个 变量 的 概率 分 布 ， 所 以 ， 
若 要 计算 样本 均值 的 概率 ， 就 需要 知道 样本 均值 的 分 布 。 我 们 的 例子 是 
这 样 的 : 在 一 个 有 30 袋 糖 球 的 样本 中 ， 求 糖 球 数目 的 均值 小 于 或 等 于 
8.5 的 概率 。 

和 比例 的 抽样 分 布 一 样 ， 为 了 能 够 动手 计算 概率 ， 先 要 知道 分 布 的 期 望 
和 方差 。 
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x 的 著名 


求 入 的 期 望 
前 面 讲 过 如 何 构 建 均值 的 抽样 分 布 ， 即 考 虚 所 有 大 小 为 n 的 可 能 样 
本 ， 然 后 用 这 些 样 本 的 均值 形成 一 个 分 布 。 


为 了 能 用 分 布 求 出 概率 ， 先 要 求 出 X 的 期 望 和 方差 。 让 我 们 先 求 
E(X)。 


这 里 的 X 是 样本 中 的 每 一 袋 糖 球 的 容量 均值 ， 即 ; 


一 XX]+X+...+X 
Cn 
n 


其 中 X 代 表 第 禾 糖 球 的 容量 ,我 们 可 以 利用 它 求 出 E(X)。 


a (Ce ) 
E(X) = E〖 一 一 
n 这 三 个 表达 站 是 一 梳 


网 .只 是 写法 变 了 底 。 


1 1 /fi 可 以 将 这 个 英子 折 今 为 w 个 
=E = +E a2 + … 十 下 KL 单 稳 的 期 晤 ， 国 为 : 


一 {Y). 
给 一 个 期 蛙 都 包含 1 人 EX + YY) E(X) + ElY, 


提 肾 出 来 . 
毛 (RX) = nE(X). 


即 ， 只 要 我 们 知道 每 一 个 Xi 的 期 望 、 就 能 得 出 E(X) 的 表达 式 。 


这 里 的 每 一 个 Xi 都 是 X 的 一 个 独立 观察 值 ， 且 我 们 已 知 E(X)= 上 也 就 
是 说 ， 可 以 用 hh 代替 上 式 中 的 各 个 E(X;)。 


于 是 得 到 什么 呢 ? 
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进行 预测 


让 我 们 用 代替 各 个 E(Xi)。 
x 的 商户 是 目 ，E(CXD 三 + 


E(X) et 沪 十 陛 生 si 富生 】 适用 于 每 一 个 i, 
n 
1 个 
=—(#h) 一 有 
fr 
=b 


也 就 是 说 E(X)=h ， 即 所 有 大 小 为 n 的 可 能 样本 的 均值 的 平均 数 等 于 作为 
样本 来 源 的 总 体 的 均值 一 实际 上 ， 你 所 求 的 是 所 有 可 能 均值 的 均值 。 


其 实 这 十 分 符合 直觉 一 总 的 看 来 ， 你 会 期 望 一 个 样本 的 每 袋 糖 球 平均 
容量 等 于 总 体 的 每 袋 糖 球 平均 容量 。 在 我 们 的 具体 例子 中 ， 总 体 的 每 袋 
糖 球 平均 容量 为 10， 因 此 ， 我 们 会 期 望 样本 也 是 如 此 。 


四 果 吕 体 均值 为 每 党 10 颗 糖 
球 ， 那 么 ， 你 可 以 期 望 样本 
A 坊 什 也 是 每 党 10 颗 糖 妹 . 





为 了 求 出 样本 均值 的 概率 ， 我 们 还 需要 知道 什么 ? 你 认为 该 怎么 求 ? 
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又 的 方差 


X 的 方 荐 是 多 少 ? 


前 面 得 出 了 E(X) 的 算法 ， 不过， 在 计算 样本 均值 的 概率 之 前 ， 
我 们 还 需要 求 出 Var(X) ， 这 样 就 能 朝 着 X 的 分 布 再 迈 近 一 步 。 









为 什么 需要 求 
Var(X)? 难道 它 和 Yar(X) 
有 什么 不 一 样 吗 ? 未 就 是 


0 吗 ? 


又 的 分 布 不 同 于 X 的 分 布 。 


X 代 表 一 个 包装 袋 中 的 糖 球 数量 ,我 们 已 知 一 个 包装 袋 中 的 
糖 球 数目 均值 ， 且 已 知 方差 。 


每 个 包装 从 中 的 糖 球 
数量 为 10， 方差 为 1。 





X 代 表 一 个 样本 的 糖 球 容量 均值 ， 因 此 X 的 分 布 代表 所 有 可 能 样本 的 均 
值 的 分 布 。E(X) 表 示 所 有 样本 均值 的 均值 ， 而 Var(X) 指 的 是 样本 均值 
的 变异 情况 。 


求 Var(X) 的 过 程 其 实 与 求 E(X) 的 过 程 十 分 类 似 。 
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进行 预测 


统计 早 袜 贴 


通过 下 面 这 些 算式 可 求 出 样本 均值 的 方差 的 表达 式 。 可 惜 ， 有 一 部 分 算式 掉 落 了 。 你 的 任 
务 是 将 磁 贴 放 回 原 位 ， 然 后 推导 出 样本 均值 的 方差 。 入 
提示 :回头 复习 E 公 ) 





的 计算 过 程 ， 这 可 能 


A 会 对 你 有 所 帮助 。 
Var(X)=Var 一 一 一 


n 


-( ) 
Ei 


= (Var( X,) + Var(X,) + + Var(X,) ) 
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统计 量 磁 贴 解答 


统计 是 磅 贴 





J X, + X, + +X, 
Var(X) = Var a 


ED 


过 Jad | 


(Var( X,) + Var(X,) + *… + Var(X.)) 





程 确实 有 学 曲 折 ， 不 过 我 们 已 
入 者 出 了 又 的 方 又 一 载 们 加 
道 样本 均 值 会 有 多 大 差异 。 


做 到 这 一 步 已 经 很 始 。 推导 这 
n 
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通过 下 面 这 些 算式 可 求 出 样本 均值 的 方差 的 表达 式 。 可 惜 ， 有 一 部 分 算式 掉 落 了 。 你 的 任 
务 是 将 磁 贴 放 回 原 位 ， 然 后 推导 出 样本 均值 的 方差 。 





也 别 灰心 ， 这 个 练习 : 

十 分 难 。 : 
大 多 数 考试 委员 会 都 不 会 要 求 : 
推导 这 个 算式 ， 你 只 要 记 住 结 : 
: 果 就 行 了 ， 我 们 只 是 为 了 让 你 看 看 这 个 算 : 


进行 预测 


均值 的 拍 奖 分 布 妨 知 团 @、 
让 我 们 好 好 看 看 均值 的 抽样 分 布 。 


先 看 总 体 X 的 分 布 ，X 的 均值 为 上 ,方差 为 2?， 因 此 E(X) = 上 而 Var(X) = ac 。 


接着 用 来 自 总 体 X 的 所 有 大 小 为 n 的 可 能 样本 ， 形 成 所 有 样本 均值 的 分 布 一 
X 的 分 布 。 这 个 分 布 的 均值 和 方差 计算 如 下 : 
















E(X) = hb 











0 
Var(X) = 一 
的 


X 的 标准 差 即 方 差 的 平方 根 ， 这 个 标准 差 可 指出 样本 均值 与 的 可 能 偏离 距 
离 ， 因 此 被 称 为 均值 标准 误差。 





n 越 大 ， 均 值 标准 误差 越 小 。 也 就 是 说 ， 样 本 中 的 个 体 越 多 ， 作 为 总 体 均值 
的 估计 量 的 样本 均值 越 可 靠 。 
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X 的 分 布 


XX 如 何 分 布 ? 
前 面 我 们 求 出 了 的 方差 和 期 望 ， 但 还 要 知道 X 的 分 布 ， 才 能 求 出 概率 
让 我 们 先 看 X 为 正 态 分 布 时 ，X 符 合 哪 种 分 布 


下 面 是 各 种 、o* 及 n 所 对 应 的 分 布 图 ， 其 中 X 符 合 正 态 分 布 。 你 注意 
到 什么 了 ? 





各 种 情况 下 的 X 均 符合 正 态 分 布 ， 也 就 是 说 : 
这 是 旋 们 前 面 届 出 歇 X 


上 的 志 值 和 方差 ， 


如 果 X ~ N(h, co?), 则 X ~ N(h, az/m) 







但 包装 当中 的 糖 球 数 
目 符合 正 态 分 布 吗 ? 
要 是 不 符合 怎么 办 ? 


X 可 能 不 符合 正 态 分 布 。 

为 了 算出 样本 均值 的 概率 ， 我 们 需要 知道 X 的 分 布 情 
况 ， 问 题 是 ， 我 们 并 不 知道 X 如 何 分 布 。 

我 们 需要 知道 ， 如 果 X 不 符合 正 态 分 布 ，X 符 合 什么 
分 布 。 
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进行 预测 


当 h 很 大 时 ，X 仍 然 可 以 用 正 访 分 布 近似 


随 着 n 增 大 ，X 越 来 越 接 近 正 态 分 布 。 我 们 已 经 知道 ， 当 X 符 合 正 态 分 布 
时 ，X 符 合 正 态 分 布 ; 如 果 X 不 符合 正 态 分 布 ， 但 如 果 n 足 够 大 ， 我们 仍 
然 可 以 用 正 态 分 布 近 似 的 分 布 。 


现在 的 情况 是 ， 我 们 知道 总 体 的 均值 和 方差 ， 但 却 不 知道 总 体 的 分 布 。 
不 过 ， 这 没关系 ， 由 于 样本 大 小 为 30, 我 们 还 是 能 用 正 态 分 布 求 X 的 概率 。 


这 叫做 “中 心 极限 定理 ”。 


认 织 中 心 极 限定 理 


中 心 极限 定理 是 指 : 如 果 从 一 个 非 正 态 总 体 X 中 取出 一 个 样本 ， 且 样本 
很 大 ， 则 X 的 分 布 近似 为 正 态 分 布 。 如 果 总 体 的 均值 和 方差 为 h 和 o?， 
且 n 很 大 ,例如 大 于 30， 则 : 


= 这 征 又 的 均 ， 
X ~ N(b，G2/m) ts#. 


是 不 是 觉得 很 熟悉 ?这 和 X 符 合 正 态 分 布 时 的 情况 是 一 样 的。 唯一 的 
差别 是 ， 当 X 符 合 正 态 分 布 时 ， 样 本 的 大 小 无 所 谓 。 


根据 中 心 慑 限定 理 ， 如 果 X 的 样 柬 很 大 ， 则 XxX 的 分 布 近 似 
为 正 态 分 布 。 
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中 心 极限 定理 


使 用 了 电 心 极限 定理 


在 实践 中 ， 中 心 极限 定理 有 什么 作用 呢 ? 让 我 们 看 一 看 。 


二 项 分 布 
假设 你 有 一 个 总 体 ， 用 X ~ Btn,p ) 表示 ， 其 中 n 大 于 30。 如 前 所 述 ， =np， 
ao2 = npq， 


根据 中 心 极限 定理 ， 在 这 种 情况 下 ，X ~ N(j,o2/n)。 为 了 求 出 X 的 分 布 ， 

我 们 代 人 总 体 的 数值 ， 即 ， 代 和 = np 和 a? = npq， 得 到 : 
二 对 于 二 项 分 布 ， 吕 体 场 针 为 中 ， 方 郑 为 4， 如果 
X ~ N(np, pq) 《“ 训 这 此 区 也 代入 扫 榜 分布， 出 得 到 XX 一 Nnp, PA 


治 松 分布 


现在 ,假设 总 体 符合 泊 松 分 布 X ~ Po( 和), n 还 是 大 于 30。 对 于 泊 松 分 布 来 
说 ， 内 三 G? = Ao 


和 以 前 一 样 ， 我 们 可 以 借助 正 态 分 布 求 出 c? 的 概率 。 如 果 将 以 上 总 体 参 数 
代 人 文 ~ N(h ,azrn)， 得 到 : 
对 于 泊 朴 今 布 来 说 ， 场 值 和 方 盖 都 为 和 ， 将 这 
X ~ NO Mn) 出 参 数 代入 抽样 分 布 ， 得 到 X 一 N( 和 ,3X /0。 


一 般 情 况 下 上 会 使 用 分 布 X ~ N( k， G2rm) 中 并 代 人 作 和 c? 的 数值 。 


求 出 概率 


由 于 X 符 合 正 态 分 布 ， 于 是 可 以 用 标准 正 态 概率 表 查 找 概率 ， 也 就 是 说 ， 
其 他 正 态 分 布 的 算法 完全 适用 于 你 的 情况 。 
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进行 预测 


加 让 我 们 用 以 上 结论 解决 曼 帝 糖果 公司 的 问题 。 


钛 习 每 开 糖 球 的 均值 为 10， 方 差 为 1， 如 果 抽 取 一 个 有 30 袋 糖 球 的 样本 ， 那 么 样本 均值 小 于 等 
于 8.5( 颗 / 袋 ) 的 概率 是 多 少 ? 请 按照 给 出 的 步骤 进行 计算 。 


1. X 符 合 禾 种 分 布 ? 


2. P(X < 8.5) 的 数值 是 多 少 ? 


第 11 意 总 体 和 样本 的 估计 483 


练习 解答 


让 我 们 用 以 上 结论 解决 曼 帝 糖果 公司 的 问题 。 


习 每 袋 糖 球 的 均值 为 10， 方 差 为 1， 如 果 抽 取 一 个 有 30 袋 糖 球 的 样本 ， 那 么 样本 均值 小 于 等 
解 于 8.5( 里 / 袋 ) 的 概率 是 多 少 ?” 请 按照 给 出 的 步骤 进行 计算 。 





1. X 符 合 娜 种 分 布 ? 
我 们 已 知 X 一 NU Gzwj，n = 10, og 二 1, Ww 二 30， 而 1/30 = 0.0333， 于 是 得 和 到， 


XX ~ N(10, 0.0333) 


2. P(X < 8.5) 的 数值 是 多 少 ? 
由 于 又 一 N{(10, 0.0333) ， 我 们 需要 求 3.5 白 标准 分 ， 以 便 能 坊 在 报 率 表 中 查找 千 累 。 禄 到: 
8.5-10 
Zz = 
V0.0333 
二 -8.22 {保留 岗位 小 数 ) 





PZ <Z) = PZ < -8.22) 


这 个 概率 太 小 了 ， 因 此 未 水 瑰 在 概率 关中 。 我 们 可 中 认 芍 村 率 因此 之 小 欣 事 件 几 乎 不 会 忠 现 ， 
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阅 : ”中心 极限 定理 要 求 进行 任何 
连续 性 修正 吗 ? 


答 ; 问 得 好 ,回答 是 : 不 用 。 你 
使 用 中 心 极限 定理 求 出 的 概率 与 样本 
均值 有 关 ， 而 与 样本 中 的 数值 无 关 。 
因此 不 需要 进行 任何 连续 性 修正 。 


和 ”如 果 考 虑 同一 个 总 体 中 所 有 大 小 为 n 的 可 能 样 。 旧 


世上 没有 俐 问题 


阔 :点 估计 重 和 抽样 分 布 之 间 有 
关系 吗 ? 


每 : 有 关系 。 让 我 们 先 看 均值 。 
总 体 均 值 的 点 估计 量 为 又 ， 即 请 = 
义 。 那 么 均值 的 抽样 分 布 的 期 望 则 为 
E(X)= hu。 全 部 样本 均值 的 期 望 等 于 
上 ， 我 们 可 以 用 样本 均值 估计 上 。 


与 此 相似 ， 总 体 比 例 的 点 和 估计 量 汶 
P,， 即 样本 比例 ， 也 就 是 说 p=P,。 如 
果 我 们 取 全 部 样本 比例 的 期 望 ， 可 得 
E(PJ=p。 全 部 样本 比例 的 期 望 等 于 p， 
于 是 我 们 可 以 用 样本 比例 估计 p。 


对 于 方差 ,我 们 就 不 打算 在 这 里 进 
行 证 明了 ,但 结果 相似 ， 即 : 


gl= 85, E(S) = o?。 


本 ， 然 后 用 这 些 样本 的 均值 形成 分 布 ， 则 该 分 


布 为 “均值 的 抽样 分 布 ”， 我 们 用 X 表 示 样 本 均 


值 随机 变量 。 


X 的 期 望 和 方差 的 定义 式 为 : 


EC = 4 


Var{lX} = g An 


进行 预测 


阅 :这 是 巧合 吗 ? 


每 : 这 并 非 巧 合 ， 估 计量 是 这 样 
选择 的 :以 同样 方法 抽取 大 小 为 的 
大 重 样本 ， 使 得 这 些 样本 的 期 望 等 于 
总体 参数 的 真 值 。 如 果 做 到 了 这 一 点 ， 
我 们 就 说 这 些 估计 重 是 无 偏 估计 重 。 


无 偏 估 计量 有 可 能 准确 无 误 ， 这 是 
因为 ,从 所 有 可 能 样本 的 平均 情况 
上 看 ， 下 以 期 望 该 估计 量 等 于 真实 的 
总 体 参 数 。 


培 ， 标准 误差 与 此 有 何 关系 ? 
答 ;总体 参数 的 最 佳 无 偏 信 计 重 


通常 为 方差 最 小 的 估计 重 ， 妈 标准 误 
差 最 小 的 估计 量 。 


“均值 的 标准 误差 ”等 于 该 分 布 的 标准 差 ， 即 : 
VVvartX) 


如 果 X~N{p,o2D), 则 X~N(b, on). 


@ 中 心 极 限定 理 说 的 是 : 如 果 n 很 大 且 X 不 符合 正 


态 分 布 ， 则 : 


其 中 4 和 oa? 为 总 体 的 均值 和 方差 。 





X~N(p, on) 
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糖 球 抽样 万 岁 


抽样 结果 担 转 乾坤 ! 










二 查 真 染 训 1 我 的 顶级 密 户 在 一 个 30 党 厅 妹 的 样本 
中 发 现 厌 妹 的 平声 数目 为 8.5， 而 你 告诉 我 这 样 的 概 
率 鹤 不 可 能 出 痢 . 这 说 明 我 不 用 为 彤 俊 这 此 不 开心 
的 审 户 而 担心 了 ， 我 赚 了 | 


你 大 有 进步 


你 不 仅 能 根据 一 个 样本 得 出 总 体 参 数 的 点 估计 晤 ,还 能 
通过 总 体 计算 出 样本 的 概率 一 - 实在 是 强 遇 。 
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12 置信 和 区间 的 构建 
A 
“自信 地 猜测 ， 


我 把 这 道 莱 放 在 烤箱 里 
烤 2.5 小 时 ， 未 过 要 是 你 
烤 的 话 ， 就 用 1 一 5 个 小 
时 吧 ， 准 没 错 儿 ， 





有 时候 样本 无 法 给 出 足够 正确 的 结果 。 

前 面 讲 到 如 何 用 点 估计 量 估 计 总 体 均值 、 方 差 或 一 定 比 例 的 精确 值 。 问 题 在 于 ， 你 
怎么 能 肯定 自己 的 估计 完全 正确 ? 毕竟 ， 你 仅仅 依靠 一 个 样本 对 总 体 作出 假设 ， 如 
果 这 个 样本 出 问题 怎么 办 ? 本 章 将 介绍 另 一 种 估计 总 体 统计 量 的 方法 一 一 种 考虑 
了 不 确定 性 的 方法 。 拿 出 你 的 概率 表 ， 我 们 将 向 你 讲解 置信 区 间 的 来 龙 去 脉 。 


进入 新 的 篇 章 
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另 一 次 口味 测试 


曙 帝 糖果 出 事 了 


曼 帝 糖果 公司 的 首席 执行 官 大 做 广告 ， 他 言 之 辫 凿 、 满 怀 骄 做 
地 宣布 了 超 长 效 糖 球 的 口味 持续 时 间 一 精确 到 秒 。 









我 们 碰 到 麻 类 了 .有 人 
入行 作 了 测试 ， 得 出 了 未 
同 的 结果 。 他 们 成 胁 说 要 
上 告 我 们 ,这 可 是 要 花 钱 网 . 








曼 帝 糖果 公司 用 一 个 包含 100 粒 糖 球 的 样本 得 出 口味 持续 时 间 均 
值 的 点 估计 最 为 62.7 分 钟 ， 同 时 总 体 方差 的 点 估计 量 为 25 分 钟 。 
首席 执行 官 在 电视 节目 黄金 时 段 宣布 ; 糖 球 口 味 的 平均 持续 时 间 
为 62.7 分 钟 。 这 是 根据 手头 证 据 有 可 能 得 出 的 最 可 靠 的 口味 持续 
时 间 和 估计 ， 可 要 是 略 有 差 池 ， 那 该 怎么 办 ? 

如 果 有 人 因为 曼 帝 糖果 公司 的 广告 和 他 们 打 官 司 ， 公 司 就 会 叉 赔 
钱 又 和 生意 。 他 们 需要 你 帮忙 摆脱 困境 。 


他 们 需要 你 出 手相 救 。 


0 动 动脑 


你 认为 错 在 娜 里 ” 曼 帝 糖果 公司 是 否 应 该 用 点 佑 计量 的 精确 值 做 广告 ” 为什么? 
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自信 地 猪 测 


精度 中 起 的 问题 


如 上 一 章 所 讲 ， 点 估计 量 是 我 们 有 可 能 给 出 的 总 体 统计 量 的 最 佳 
估计 。 你 取 用 最 具 代 表 性 的 数据 样本 ， 以 此 估计 总 体 的 主要 统计 
量 ， 如 均值 、 方 差 、 比 例 ， 这 意味 着 超 长 效 口香糖 球 的 口味 持续 
时 间 均 值 的 点 估计 和 朋 是 我 们 有 可 能 给 出 的 最 佳 估计 。 


点 估计 量 的 推导 过 程 存在 这 样 的 问题 : 我 们 依赖 来 自 唯 一 的 一 个 
样本 的 结果 得 出 非常 精确 的 估计 。 我 们 想 了 很 多 办 法 ， 确 保 样 本 
无 偏 ， 使 样本 尽量 具有 代表 性 ; 但 对 于 这 个 样本 是 不 是 能 100% 地 
代表 总 体 ， 我 们 并 没有 绝对 的 把 握 ， 原 因 很 简单 一 我 们 用 的 是 
样本 。 













打 储 ! 你 是 说 点 估计 量 
东 好 用 ? 千 主 万 苦 算 来 
算 去 ， 到 藉 达 却说 不 好 
用 ? 


点 估计 量 是 有 价值 的 ， 但 也 许 存 在 小 小 的 误差 。 

由 于 我 们 并 没有 使 用 整个 总 体 ， 归 根 结 底 ， 我 们 只 是 得 到 了 最 佳 
估计 量 。 如 果 我 们 所 用 的 样本 无 偏 ， 则 这 个 估计 重 很 可 能 接近 总 
体 的 真 值 。 问 题 是 ， 多 接近 才 算 “ 够 接近 ”? 


与 其 给 出 一 个 精确 值 作为 总 体 均 值 的 估计 值 ， 不 如 采用 另 一 种 方 
法 。 我 们 可 以 指定 某 个 区 间 一 - 而 不 是 用 一 个 十 分 精确 的 时 间 长 
度 ， 作 为 糖 球 口味 持续 时 间 的 估计 。 例 如 ， 我 们 可 以 说 : 我 们 期 
望 糖 球 的 口味 持续 时 间 为 55 至 65 分 钟 ， 这 仍然 会 让 听 者 觉得 糖 球 
口味 持续 时 间接 近 1 小 时 ， 但 却 留 有 更 大 的 误差 空间 。 


问题 是 ， 我 们 如 何 确定 区 间 ? 这 就 看 你 希望 自己 对 结果 有 多 大 自 
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全 面 了 解 置信 区 间 


认识 置信 区 加 


此 前 ， 我 们 以 样本 数据 为 基础 ， 利 用 点 估计 量 估计 了 糖 球 口味 持续 时 间 
的 均值 ， 通 过 点 估计 量 ， 我 们 能 够 给 出 糖 球 口味 平均 持续 时 间 的 非常 精 
确 的 估计 。 下 面 这 张 图 体现 了 糖 球 样本 口味 持续 时 间 的 分 布 。 
晤 过 点 个 入 重 ， 载 们 用 衬 奉 
均值 估计 总 体 均值 。 





那么 ， 如 果 我 们 为 总 体 均值 指定 一 个 区 间 ， 情 况 会 怎么 样 呢 ? 我 们 不 指 
定 一 个 确切 的 数值 ， 而 指定 两 个 数值 一 我 们 期 望 糖 球 口味 持续 时 间 介 
于 这 两 个 数值 之 间 。 我 们 让 均值 的 点 估计 量 处 于 这 个 区 间 的 中 央 ， 并 将 
这 个 区 间 的 上 下 限 设 定 为 这 个 点 估计 量 加 上 或 减 去 某 个 误差 。 






i 小 出 
未 委 从 出 总 体 坪 值 的 精确 估计 ， 而 是 。 


! 之 网 . 
po 





选择 区 间 上 下 限 是 为 了 让 “总 体 均值 介 于 a 和 b 之 间 ” 这 一 结果 具有 特定 
概率 。 例 如 ， 你 可 能 希望 通过 选择 a 和 b， 使 得 该 区 间 中 包含 总 体 均 值 的 
几率 为 95%。 也 就 是 说 ， 所 选择 的 a 和 b 使 得 : 


Pl(a< php <b)= 0.95 


我 们 用 (a,b) 表 示 这 个 区 间 ， 由 于 a 和 b 的 确切 数值 取决 于 你 希望 自己 对 于 
“该 区 间 包 含 总 体 均值 ”这 一 结果 具有 的 可 信 程度 ， 因 此 ，(a, b) 被 称 为 置信 
区 间 。 


那么 ,我 们 如 何 求 总 体 均值 的 置信 区 间 ? 


490 深入浅出 统计 学 


自信 地 猜测 


求解 置信 区 间 欠 步骤 


下 面 是 求解 晤 信 区 间 的 几 大 步骤 。 要 是 没 办 法 一 下 子 弄 明白 每 个 步骤 的 
目的 ， 别 担心 ， 我 们 很 快 会 具体 讲解 。 


是 扩大 望 用 于 构建 置信 区 间 的 
上 一 章 计 过 ”区 。。 选 择 总 体 统计 量 一 3 付 统 计量. 
抽样 分 布 ， 
方 四 求 出 其 抽样 分 布 ee 
你 选择 的 区 间 中 包含 该 议 作 : 
个 。 类 定年 他 水 平 夺 
© Rum 人 tfR eC skieriig 


我 们 需要 


知道 置信 水 平和 抽 样 今 市 ， 


让 我 们 看 看 是 否 能 够 替 曼 帝 糖 果 首 席 执行 官 构建 一 个 可 以 进行 广告 宣 
传 的 置信 区 间 一 让 我 们 求 出 糖 球 口 味 持续 时 间 均 值 的 置信 区 间 。 


阅 :你 能 为 任何 一 个 总 体 统计 晤 
构建 一 个 置信 区 间 吗 ? 


签 :一般 说 来， 只 要 知道 抽样 
分 布 ， 就 能 为 任何 总 体 统计 量 构 奸 
置信 区 间 。 我 们 已 经 讲 过 均值 和 比 
例 的 抽 祥 分布 ， 央 此 能 够 为 这 两 个 
统计 对 构建 置信 区 闻 。 


世上 没有 傻 问 题 


阅 :方差 呢 ? 我 们 能 为 方差 构建 
置信 区 间 吗 ? 


答 ; 理论 上 是 可 以 的 ,不 过 我 
们 还 没有 讲 过 方差 的 分 布 ， 也 不 打 
算 讲 。 较 为 常见 的 做 法 是 构建 均值 
和 比例 的 置信 区 间 ， 统计 学 考试 往 
往 考 这 些 内 容 。 


阅 :上 面 这 些 步骤 是 和 均值 的 填 
信 区 间 有 关系 还 是 和 比例 的 置信 区 间 
有 关系 ? 


签 ; 这 些 步 又 对 于 二 者 是 通用 
的 一 一 既 可 以 用 于 总 体 均值 ， 也 可 以 
用 于 总 体 比 例 ， 


阅 : 总体 的 分 布 情况 是 否 有 关系 ? 


签 : 关键 在 于 你 要 为 之 构建 重 
信 区 间 的 统计 重 的 抽样 分 布 ， 如 果 
想 求 均值 的 置信 区 间 ， 就 要 知道 罗 
值 的 抽样 分 布 ; 如 果 想 求 比例 的 时 
信 有 区间， 就 要 知道 比例 的 抽样 分 布 。 


总 体 分 布 对 置信 区 间 的 主要 影响 在 
于 它 对 抽样 分 布 的 影响 。 我 们 随后 
加 以 并 述 。 
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逐步 梅 建 商 倍 区 测 


第 1 步 ， 选择 总 体 统 计量 


第 1 步 是 选取 要 为 之 构建 置信 区 间 的 统计 量 ， 这 取 次 于 要 解决 的 实际 
问题 。 


在 我 们 的 实例 中 ， 需 要 为 口香糖 球 口味 持续 时 间 的 均值 构建 一 个 置信 
区 间 ， 于 是 就 需要 为 总 体 均值 构建 一 个 置信 区 间 。 


选 好 总 体 统计 量 ， 就 可 以 进行 下 一 步 了 。 


第 Z 步 : 求 出 所 选 统 计量 的 抽样 分 布 


为 了 求 出 总 体 均值 的 抽样 分 布 ， 我 们 需要 知道 均值 的 抽样 分 布 ， 即 需 


要 知道 X 的 期 望 和 方差 以 及 其 分 布 。 
让 我 们 先 求 期 望 和 方差 。 回 顾 上 一 章 的 内 容 ， 我 们 知道 均值 的 抽样 分 
布 的 期 望 和 方差 为 : 

E(X)= ph, Var(X) 过 


为 了 利用 以 上 结果 求 出 的 置信 和 区间， 我 们 代入 总 体 方差 的 数值 9 ?和 
样本 大 小 的 数值 n。 











那 上 呢 ? 为 什么 不 
代入 的 数值 ? 


我 们 不 代入 b 的 数值 ， 这 是 因为 我 们 正在 为 这 个 数值 求 置 信 区 间 。 


我 们 正在 利用 抽样 分 布 求 的 置信 区 间 ， 因此， 除了 以 外 ,我 们 代 
人 所 有 数值 。 代 人 ?和 mn 之 后 ， 就 能 用 X 的 分 布 求 出 置信 区 间 ， 我 们 
很 快 就 会 进行 说 明 。 

只 有 一 个 问题 一 我 们 并 不 知道 o ?的 真 值 ， 必 须根 据 样本 进行 估计 。 
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自信 地 猜测 


点 估计 量 出 手相 救 


那么 用 哪个 数值 作为 值 呢 ? 


尽管 我 们 不 知道 总 体 方差 o :的 真实 值 ， 却 可 以 用 它 的 点 估计 量 进行 
估计 。 于 是 我 们 代 人 6， 或 者 叫 微 s*， 而 不 是 ?。 


于 是 均值 的 抽样 分 布 的 均值 和 方差 等 于 : 
生生 方 莫 的 点 估计 重 ， 我 们 不 知道 如 体 广大 风 
FE(X) = 上 Var(X) = < 友 一 各 实 值 是 多 几 ， 于 是 网 撞 杰 方 着 进行 估计 ， 


n 


vw 


曼 帝 糖果 公司 用 包含 100 颗 糖 球 的 样本 计算 估计 值 ， 并 算得 %: = 25， 
于 是 : 


= 0.25 


还 有 一 事 待定 : 为 了 能 求 出 hh 的 置信 区 间 ， 我 们 需要 清楚 地 知道 X 的 
分 布 。 


& 


\ 汉 动 基 









假定 X~N(u ，g2)， 且 样本 包含 的 数目 很 大 。X 符 合 娜 种 分 布 ? 
用 前 面 算出 的 E(X) 和 Var(X) 来 帮忙 。 
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假定 X~N(h ，o?)， 且 样本 包含 的 数量 很 大 。X 符 合 哪 种 分 布 ? 
用 前 面 算出 的 E(X) 和 Var(X) 来 帮忙 。 


风 果 X 符 合 正 态 分 布 ， 那 么 X 也 符合 正 态 分 布 ， 代 入 a ?的 点 估计 量 ， 得 到 ， 


父 关 N(h, s/n) 


或 


X~ N(h,0.25) 


我 们 已 经 求 出 了 X 的 分 布 


既然 已 经 知道 X 的 分 布 情况 ， 我们 就 有 了 足够 的 信息 ， 可 以 进入 下 
一 步 。 


置信 水 平 表 明 你 希望 自己 对 于 “置信 区 间 包 含 总 体 统计 量 ” 这 一 说 法 
有 多 大 把 握 。 例 如 ， 假 设 我 们 希望 总 体 均值 的 置信 水 平 为 95%， 这 表 
示 总 体 均 值 处 于 置信 区 间 中 的 概率 为 0.95。 





时 信 水 平 即 总 体 均值 处 于 亚信 息 站 


tc 4 内 的 概率 车 置 入 水 平 为 95 思 ， 
则 相应 概率 为 0.92 . 









你 觉得 置信 水 平 对 置信 区 间 的 大 小 有 何 影响 ? 
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自 德 地 猜测 


如 何 选 挣 合适 的 置信 水 乎 
那么 由 谁 来 决定 置信 水 平 ? 多 大 的 坚信 水 平 才 合适 ? 


答案 完全 取决 于 你 的 具体 情况 以 及 你 需要 对 “区 间 中 包含 总 体 统计 
量 ”这 一 说 法 有 多 大 信心 。 常 用 的 置信 水 平 是 95%， 但 有 时 候 你 可 
能 会 男 有 要 求 ， 如 90% 或 99%。 例 如 ， 曼 帝 糖 果 公 司 首席 执行 官 希望 
对 “总体 均值 位 于 置信 区 间 之 中 ”这 一 说 法 有 更 大 的 信心 ， 这 样 他 
才能 在 电视 中 广 而 告 之 。 


关键 是 记 住 这 一 点 : 置信 水 平 越 高 ， 区 间 越 宽 ， 置 信 区 间 包 含 总 体 
统计 大 的 几率 越 大 。 








践 ， 为 什么 外 把 置信 区 阅 青 得 
足够 党 呢 ? 这 和 社 就 表 完 能 把 统 
计量 包含 在 其 中 了 ， 


把 置信 区 间 弄 得 太 宽 的 问题 是 : 置信 区 间 会 失去 其 意义 。 


举 个 极端 例子 : 我 们 可 以 说 糖 球 口味 持续 时 间 的 均值 在 0 至 3 天 之 
间 。 这 固然 不 错 ， 但 你 却 无 法 据 此 知道 糖 球 口味 实际 上 能 持续 
多 久 一 不 知道 持续 时 间 是 几 秒 ， 几 分 钟 ， 还 是 几 小 时 。 


关键 在 于 ， 要 让 区 间 尽 可 能 窜 , 但 又 要 足够 宽 ， 这样 才 能 合理 
地 相信 和 真正 的 均值 就 在 区 间 之 中 。 


让 我 们 为 曼 帝 糖果 公司 选用 95% 的 置信 水 平 ， 如 此 一 来 ， 区 间 中 包 
含 总 体 均值 的 概率 就 很 高 了 。 


既然 已 经 选 定 了 置信 水 平 ， 就 可 以 进入 最 后 一 步 : 求 出 置信 上 下 限 。 
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园 信 上 下 限 


第 4 步 : 求 出 置信 上 下 限 


最 后 一 步 是 求 a 和 b 一 一 置信 区 间 的 上 下 限 ， 上 下 限 指出 一 个 范围 的 

左右 边界 一 均值 有 95% 的 概率 落 入 这 个 范围 中 。a 和 b 的 确切 值 取 

决 于 需要 使 用 的 抽样 分 布 以 及 需要 具有 的 置信 水 平 。 

对 于 我 们 的 实例 ， 需 要 让 糖 球 口味 持续 时 间 均 值 具有 95% 的 置信 度 ， 

即 ， 位 于 我 们 求 得 的 a 和 b 之 间 的 概率 必须 为 0.95。 我 们 还 知道 ，X 

守 合 正 态 分 布 ， 其 中 X ~ N(b ,0.25)。 

使 得 这 块 


下 面 是 我 们 需要 使 用 的 一 张 草图 : 我 们 需要 选 持 % 和 0， 
面积 的 概率 为 


0.95 。 





这 两 块 面积 相 加 应 该 等 于 0.05， 因 此 
每 一 条 尾巴 是 0.025。 


利用 X 的 分 布 我 们 可 以 求 出 a 和 b 的 值 。 即 ， 我 们 可 以 利用 X~N(p,0.25) 
求 出 a 和 b， 例 如 P(X < a) = 0.025 和 P(X > b) = 0.025。 


意思 是 说 我 们 用 正 态 分 


布 届 上 的 置信 区 间 ? 







由 于 X 符合 正 态 分 布 ， 所 以 我 们 可 以 用 正 态 分 布 求 置信 区 间 。 
具体 算法 和 前 面 讲 过 的 其 他 问题 的 算法 相似 : 算出 标准 分 ， 查询 标准 正 
态 分 布 概率 表 ， 得 出 所 需要 的 结 eR 
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自信 地 清 测 


先 求 Z 


为 了 能 够 利用 正 态 分 布 表 ， 先 对 X 进 行 标准 化 。 我 们 已 知 X ~ N( 上 ,025)， 
于 是 ， 经 过 标准 化 计算 ， 得 到 : 


Zr 其 中 Z ~ NI(0, 1) 
\V0.25 
下 面 是 经 过 标准 化 的 置信 区 间 图 形 ; 





我 们 需要 求 出 zs。 和 za， 其 中 P(z < Z <z) = 0.95， 即 标准 置信 上 下 限 
为 z 和 zb， 其 中 P(Z < za) = 0.025 且 P(Z > zb) = 0.0255。 利 用 概率 表 
可 以 求 出 zs。 和 zb 的 值 。 


1. 使 用 概率 表 求 出 Zs 的 数值 ， 使 得 P(Z < za) = 0.025。 





我 们 需要 求 出 z。 和 z,, 使 得 P(z。< 2 < zu) = 0.95。 









2. 使 用 概率 表 求 出 Zt 的 数值 ， 使 得 P(Z > zo) = 0.025。 
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动 动笔 解答 


心动 动笔 
AS 解答 


1. 使 用 概率 表 求 出 Zs 的 数值 ， 使 得 P(Z < za) = 0.025 。 
在 标准 概率 表 中 查找 0.025， 得 zu = -1.96，, 














我 们 需要 求 出 z, 和 z。， 使 得 P(z, < Z< z,) = 0.95。 


2. 使 用 概率 表 求 出 Zb 的 数值 ， 使 得 P(Z > zb) = 0.025 。 
对 于 乙 ， 需要 查找 0.975， 得 ze = 1.96. 


用 改写 不 等 式 


到 此 为 止 ， 我 们 求 出 了 置信 区 间 的 标准 形式 ， 得 到 
Pp(-1.96 < Z < 1.96) = 0.95， 即 : 


X—h 
pl -1.96< <1.96 | =0.95 
0.5 


可 我 们 需要 的 不 是 
网 置信 区 间 吗 ? 这 怎 
么 刺 ? 














用 hu 改写 不 等 式 ， 即 可 以 得 到 的 置信 区 间 。 
如 果 将 


A de i 
0.5 





这 个 次 各 给 出 了 


改写 为 这 种 形式 : J 4 的 区 间 . 


a< 此 <hb 


就 能 得 到 上 .的 上 下 限 . 
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自信 地 猜测 


将 妙 池 


你 的 任务 是 改写 -1.96<(X-h )/0.5<1.96， 
得 出 "的 置信 区 间 。 从 池 中 取出 零星 公 
式 ， 放 在 空白 的 横 线 上 。 每 一 个 公式 
碎片 的 使 用 次 数 不 得 超过 一 次 。 





X 





人 是 不 等 式 去 边 . 一 -1.96< PN 


-bh 
0.5 


GR <1.96 
0.5 
-1.96 x i <X-hHh X-h< X 0.5 
PT HE X< ei 
SO <h 


这 是 综合 起 来 的 结果 ， 


X-0.98<hu<X+0.98 


说 明 : 池 中 的 每 一 个 
因 式 只 能 用 一 次 ! 
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等 妙 池 解 管 


你 的 任务 是 改写 -1.96<(X-p )/0.5< 1.96， 
得 出 b 的 置信 和 区间。 从 池 中 取出 零星 公 
式 ， 放 在 空白 的 横 线 上 。 每 一 个 公式 碎 
片 的 使 用 次 数 不 得 一 次 ， 








Re oe ROE 
0.5 
-1.96x 0.5 <X-h X H< 1.96 x0.5 
WR X< 098 +h 
H<..X+0.98. X-0.98 <h 


X-0.98 <hu<X+0.98 


说 明 : 池 中 的 每 一 个 
因 式 只 能 用 一 次 ! 
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最 后 求 的 数值 


写 出 不 等 式 后 ,我 们 就 非常 接近 描述 糖 球 典型 口味 持续 时 间 的 数 
值 一 -的 置信 区 间 。 即 ， 我们 使 用 : 


P(X -0.98 < ph <X+0.98) = 0.95 


下 面 是 草图 : 





我 们 的 置信 上 下 限 为 X - 0.98 和 X + 0.98， 只 要 知道 用 哪个 数值 作 
为 X， 就 能 得 出 置信 上 下 限 











我 在 想 是 不 是 能 想 办 法 
用 上 明帝 糖果 公司 歇 样 东 ， 
也 许可 以 用 上 样 东 均值 . 









X 指 的 是 样本 均值 的 分 布 ， 于 是 我 们 可 以 采用 来 自 曼 帝 糖果 公 
司 样本 的 x 值 。 


和 ~ 蕊 泌 苞 









置信 上 下 限 分 别 为 X 一 0.98 和 X + 0.98， 对 于 明帝 糖果 公司 
的 样本 ，X 为 62.7 。 请 使 用 这 个 数值 求 出 置信 上 下 限 的 数值 。 
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动 动笔 解答 


动 支 荡 
下 解 管 


置信 上 下 限 今 别 为 多- 0.98 和 X 十 0.98， 如 果 代 入 样本 均 馆 ， 则 置信 上 下 限 等 于 62.7 - 0.98 和 62.7 十 0.98， 
即 置 信 区 阅 和 为 (61.72, 63.68) 。 





置信 上 下 限 分 别 为 X - 0.98 和 X+ 0.98， 对 于 景帝 糖果 公司 
的 样本 ，X 为 62.7 。 请 使 用 这 个 数值 求 出 荀 信 上 下 限 的 数值 。 






你 求 出 3 了 置信 区 阅 


祝贺 ! 你 旗 开 得 胜 ， 求 出 了 一 个 置信 区 间 。 你 的 结论 是 : 区 
间 (61.72,63.68} 中 包含 糖 球 口味 持续 时 间 总 体 均 值 的 几率 是 
95%。 









操 级 棒 的 消息 ! 这 人 么 说 我 能 更 
新 那些 漂亮 的 广告 用 语 了 ， 这 
就 不 存在 打 官 号 的 问题 了 . 


首席 执行 官 在 电视 广告 中 用 置信 区 间 了 到 代 了 点 估计 量 ， 给 出 了 对 
糖 球 口味 持续 时 间 的 准确 而 精确 的 估计 ， 却 不 必 提 到 精确 的 数 
字 一 就算 样本 有 误差 也 还 有 周旋 余地 。 
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自信 地 猪 测 


步骤 总 结 
让 我 们 复习 一 下 前 面 讲 过 的 置信 区 间 的 构建 步 卫 。 


首先 选择 用 于 构建 置信 区 间 的 总 体 统计 量 。 我 们 需要 求 出 精 球 口味 持 
续 时 间 均 值 的 曾 信 区 局 ， 于 是 需要 构建 目的 置信 区 间 。 


确定 了 用 于 构建 置信 区 间 的 总 体 统计 量 后 ， 接 着 求 其 抽样 分 布 。 我 们 
求 得 均值 的 抽样 分 布 的 期 望 和 方差 。 代 人 除 以 外 的 各 个 统计 量 的 数 
值 ， 于 是 发 现 我 们 可 以 使 用 X 的 正 态 分 布 。 


随后 ， 我 们 确定 了 用 于 构建 置信 区 间 的 置信 水 平一 95%。 


最 后 必须 求 出 奸 信 区 间 的 置信 上 上 下限。 我们 利用 置信 水 平和 抽样 分 布 
得 出 了 合适 的 置信 区 间 。 










这 人 么 说 我 每 次 都 要 通过 这 
些 步 骤 构 建 置 信 区 阅 ? 


我 们 可 以 作 一 些 简化 。 


构建 置信 区 间 会 反复 使 用 相间 步骤， 因此 可 以 作 一 些 简 化 ， 具 体 取 
决 于 所 需要 的 置信 水 平和 试验 统计 量 的 分 布 。 


让 我 们 看 看 其 中 一 些 简 化 方法 。 
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置信 区 间 小 抄 


置信 区 阅 人 简便 算法 


下 面 是 一 些 实 用 的 置信 区 间 简 便 算 法 。 你 只 要 查看 要 求 的 总 体 统计 量 、 总 
体 分 布 以 及 各 种 条 件 ， 然 后 代 和 人 总 体 统计 量 或 其 估计 量 ， 就 行 了 。 数 值 c 


取决 于 置信 水 平 。 


一 般 如 何 计算 区 间 ? 


一 般 情 况 下 ， 置 信 区 间 的 计算 式 为 : 


统计 量 土 (误差 范围 ) 


误差 范围 等 于 c 与 检验 统计 量 的 标准 差 的 乘积 。 


0 ?已 知 

n 可 大 可 小 

x 为 样本 均值 

o 已 知 

n 很 大 ( 至 少 30 ) 
x 为 样本 均值 

o ?未 知 


n 很 大 ( 至 少 30 ) 
x 为 样本 均值 

s: 为 样本 方差 

n 很 大 

p, 为 样本 比例 

q, 等 于 1-p， 





误差 范围 = c x (统计 量 的 标准 差 ) 
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3 口 

中 于 过 要 的 置信 水 插 ， 也 

,的 数值 色 决 于 所 Se 
要 以 正 态 分 布 作为 底 验 基 ， 就 可 


用 这 此 数值。 





自信 地 猜测 


加 曼 帝 糖果 公司 抽取 了 一 个 大 小 为 50 的 样本 ， 发 现 样本 中 的 红色 糖 球 的 比例 为 0.25。 请 为 总 
刁 体 中 具有 这 一 比例 的 红色 糖 球 构建 一 个 置信 水 平 为 99% 的 置信 和 区间。 
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练习 解答 


要 帝 糖 果 公 司 抽取 了 一 个 大 小 为 50 的 样本 ， 发 现 样本 中 的 红色 糖 球 的 比例 为 0.25。 请 为 总 
线 习 体 中 具有 这 一 比例 的 红色 糖 球 构建 一 个 置信 水 平 为 99% 的 置信 区 间 。 


解答 


总 体 比例 的 置信 区 网 为 ， 


《-: | 取 ?+ :fa ) 


我 们 需要 带 99% 轩 信 水 平 骨 置信 区 同 ， 轩 此 c=2.58， 红 包 糖 球 网 比例 纹 0.25， 于 是 p,=0.25 且 


MU=0.75，m=50， 于 是 得 出 : 


{0.25 x 0.75 0.25 x 0.75 
(+ 二 Pi +。 a ) = ( 0.25 - 2.58| 一 一 一, 025 + 2.58/————— ) 
。 个 和 50 | 50 


= (0.25 - 2.58 x 0.0612, 0.25 + 2.58 x 0.0612) 
= (0.25 - 0.158, 0.25 + 0.158) 


= {0,092 ,0.408) 
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| 问 :之 前 求 X 的 期 望 和 方差 的 时 
候 ， 为 什么 代入 c 的 点 估计 量 ， 却 不 
代入 b 的 点 估计 量 ? 


答 :由 于 我 们 需要 求 的 正 是 
的 置信 区 间 ， 因 此 不 用 x 代 震 上 。 我 
们 需要 求 出 含有 已 的 表达 式 ， 以 便 
求 出 置信 区 间 


| 奖 : 为 什么 用 作为 的 值 ? 


答 : XX 的 分 布 即 均值 的 抽样 分 
布 。 它 是 这 样 来 的 : 从 总 体 中 取出 
每 一 个 大 小 为 n 的 可 能 样本 ， 然 后 用 
所 有 的 样本 均值 形成 一 个 抽样 分 布 。 


Xx 是 来 自 样 本 的 特定 均值 ， 于 是 我 们 
借助 它 求 出 置信 区 间 。 


阅 : ”置信 区 间 和 置信 水 平 有 何 
区 别 ? 
从 : 置信 水 平 是 “统计 量 处 于 置 


信 区 间 之 中 ”的 概率 ， 通 常 是 一 个 百 
分 数 ， 例 如 985%。 置 信 区 间 则 给 出 了 
区 间 本 身 一 数字 实际 范围 的 上 下 限 。 


世上 没有 俐 问题 


阅 ;我 们 已 经 求 得 的 95% 置 信 
区 间 为 (61.72，63.68) ， 这 究竟 意味 着 
什么 ? 


签 :这 意味 着 : 如 果 你 打算 抽 
取 大 小 相同 的 多 个 样本 ， 然 后 为 所 有 
这 些 样 本 构建 置信 区 间 ， 则 这 些 置信 
区 间 中 有 95% 会 包含 总 体 均值 的 真实 
值 。 你 由 此 知道 ， 用 这 种 方法 构建 的 
置信 区 间 在 95% 的 情况 下 都 将 包含 总 
体 均值 


阅 :简便 算法 中 的 < 适用 于 所 有 
置信 区 间 吗 ? 


答 : 它们 适用 于 所 有 我 们 讲 过 
的 简便 算法 ， 这 是 因为 这 些 简便 算 
法 都 基于 正 态 分 布 一 -所 给 出 的 各 种 
条 件 下 的 抽样 分 布 都 符合 正 态 分 布 


| 问 : 我 曾经 看 到 置信 区 间 的 简便 
算法 中 用 的 是 “a” 而 不 是 “c”， 有 
错 吗 ? 


我 还 有 一事 相 尿 ， 
能 帮 帮 忙 吗 ? 





自信 地 猜测 


答 : 完全 没 错 。 关 键 在 于 ， 无 
论 你 把 这 个 数字 叫做 “a” 还 是 叫 
做 “c”， 它 所 代表 的 总 是 你 代入 
置信 区 间 以 便 达 到 合适 的 置信 水 平 
的 那个 数 一 - 无 论 如 何 称呼 ， 数 字 
总 是 一 样 的 。 


| 问 : ”是 否 所 有 的 置信 区 间 都 基于 
正 态 分 布 ? 


耸 : 并 非 如 此 。 我 们 随后 会 讲 
到 基于 其 他 分 布 的 区 间 


阅 :既然 只 要 在 简便 算法 中 代入 
数值 就 行 ， 为 什么 讲 那么 多 步骤 呢 ? 


答 ;， 讲 这 些 步 骤 是 为 了 让 你 看 
清楚 问题 实质 ， 理 解 置信 区 间 的 构 
建 过 程 。 大 多 数 时 候 ， 你 只 要 代入 
数值 就 行 了 。 


阅 : 使 用 置信 区 间 时 需要 进行 连 
续 性 修正 吗 ? 


答 : 理论 上 是 要 的 ， 不 过 实践 
中 常 忽 略 不 计 ， 也 就 是 说 只 要 在 简 
便 算 法 中 代入 数值 算出 置信 区 间 就 
行 了 、 


第 12 章 ”置信 区 间 的 构建 507 


置信 区 阁 两 难 问题 : 第 二 部 分 


撑 有 一 个 问题 ……: 


受 帝 糖果 公司 最 后 还 有 一 个 问题 需要 你 解决 。 有 一 家 糖果 店 想 知道 
糖 球 的 典型 重量 ， 原 因 是 他 们 发 现 顾客 往往 按照 重量 购买 糖 球 ， 而 
不 是 按照 数量 购买 。 要 是 精 果 店 知道 糖 球 的 典型 重 最 ， 就 能 利用 这 
个 信息 进行 促销 。 






这 意思 是 请 你 指出 糖 球 重音 的 置信 区 
网 。 不 过 ， 由 于 只 有 一 家 灯 果 上 店 提出 
要 求 ， 我 水 想 抽取 太 多 糖 妹 样 本 







曼 帝 糖果 公司 抽取 了 一 个 具有 代表 性 的 样本 ， 共 10 颗 ， 然 后 
称 了 每 一 粒 糖 球 的 重量 。 这 个 样本 的 x = 0.5 尊 司 ，s? = 0.09。 


我 们 如 何 求 出 置信 区 间 ? 

第 l 步 选择 总 体 统计 量 

第 1 步 是 选取 要 为 其 构建 置信 区 间 的 统计 量 。 我 们 需要 为 糖 球 重 县 均 
值 构建 一 个 置信 区 间 ， 也 就 是 要 为 总 体 均值 此 构建 置信 区 间 。 


申 于 需要 求 的 置信 区 间 ， 于 是 下 一 步 就 是 求 的 抽样 分 布 一 义 的 
分 布 。 





假设 总 体 中 的 每 一 粒 糖 球 的 重量 都 符合 正 态 分 布 ， 你 如 何 为 这 个 数据 建立 一 个 95% 置 
信 区 间 ? 提示 : 查看 前 面 的 置信 区 间 简 便 算 法 一 览 表 ， 看 看 我 们 符合 哪 种 条 件 。 
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自信 好 猜测 


第 Z 步 ， 求 X 的 概率 分 布 


那么 , X 符 合 什么 分 布 呢 ? 






这 简单 。X 符 合 正 态 分 市 ， 
因此 义 也 符合 正 态 分 市。 






并 非 任何 情况 都 能 用 正 态 分 布 进行 良好 近似 。 


我 们 前 面 讲 过 的 所 有 抽样 分 布 要 么 符合 正 态 分 布 ， 要 么 可 以 用 正 态 
分 布 进行 近似 。 问 题 是 ， 我 们 无 法 对 每 一 个 置信 区 间 都 使 用 正 态 分 
布 。 不 巧 ， 目 前 磁 上 的 就 是 这 种 不 能 用 正 态 分 布 的 情况 。 


不 能 用 正 态 分 布 的 原因 何在 ? 


当 抽样 很 大 时 ， 正 态 分 布 是 求解 置信 区 间 的 理想 分 布 一 能 得 出 精 
确 结果 , 且 与 总 体 本 身 是 否 是 正 态 分 布 无 关 。 


现在 我 们 磁 到 了 另 一 种 情况 一 尽管 X 本 身 符合 正 态 分 布 ，X 却 并 不 
符合 。 










为 什么 处 行 ? 
我 觉得 没 道 理 。 


主要 原因 有 二 。 


第 一 ， 我 们 不 知道 总 体 方差 的 确切 值 ， 因 此 必须 利用 样本 数 
据 估 计 c?， 我 们 可 以 道 过 点 估计 量 轻松 地 完成 这 项 工作 ， 人 得 
是 ， 还 有 第 二 个 原因 : 样本 太 小 ， 和 估计 值 很 有 可 能 出 现 较 大 误 
差 一 比 使 用 大 样本 的 误差 要 大 得 多 。 这 些 潜 在 的 误差 意味 着 
使 用 正 态 分 布 无 法 得 出 足够 精确 的 X 的 概率 ,那样 就 无 法 得 出 
精确 的 置信 区 间 。 


那么 ，X 符 合 哪 种 分 布 呢 ? 实际 上 ， 它 符合 t 分 布 。 让 我 们 具体 
看 看 。 
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认识 t 分 布 


当 样 本 很 小 时 , X 符合 { 分 布 


Be 
当 总 体 符合 正 态 分 布 ，o? 未 知 ， 且 可 供 支 配 的 样本 很 小 时 ，X 符 合 t 分 
布 一 - 这 种 分 布 正 好 可 以 用 来 处 理 我 们 面临 的 问题 。 


t 分 布 是 外 形 光 滑 、 对 称 的 曲线 ， 确 切 形状 取决 于 样本 大 小 。 当 样本 很 
大 时 ，t 分 布 外 形 很 像 正 态 分 布 ; 当 样 本 很 小 时 ， 曲 线 较为 扁平 ， 有 两 
条 粗 粗 的 尾巴 。 它 只 有 一 个 参数 一 v ，v =n-1。n 为 样本 的 大 小 ，v 


被 称 为 自由 度 。 人 会 在 第 14 章 中 更 滩 
入 地 探讨 自由 度 ， 


让 我 们 看 看 下 面 这 张 图 : 这 是 各 种 v 对 应 的 t 分 布 。 你 能 看 出 v 对 分 布 
形状 有 什么 影响 吗 ? 







t 今 布 的 确切 彩 状 取决 于 钳 杰 
攀 土 小 以 及 v 的 数值， 二 者 豆 


”为 相关 。 





“TT 符合 t 分 布 且 由 由 度 为 xv” 的 简明 表示 方法 为 : 


t(V) 胡 示 ， 我 们 正 挛 健 朋 自由 度 为 


1 为 扒 验 统 计量. 子玉 ~ VV) 和 t= 
计算 市 法 见 下 一 页 


t 分 布 的 使 用 方法 与 正 态 分 布 相似 一 先 将 概率 区 间 的 上 下 限 转化 为 标 
准 分， 然后 用 概率 表 求 出 所 需要 的 结果 。 


让 我 们 先 求 标准 分 。 
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自信 地 猜测 


求 { 分 布 的 标准 分 

t 分 布 的 标准 分 的 计算 方法 与 正 态 分 布 的 标准 分 的 计算 方法 相同 。 像 
处 理 正 态 分 布 一 样 ， 我 们 先 减 去 抽样 分 布 的 期 望 ， 然 后 用 所 得 到 的 差 
除 以 标准 差 。 唯 一 的 差别 是 ， 我 们 用 T 而 不 是 Z 代 表 结 果 ， 这 是 为 了 
配合 t 分 布 的 使 用 。 


我 们 需要 求 出 X 的 分 布 ， 于 是 要 用 到 X 的 期 望 和 标准 差 。 文 的 期 望 
为 hh ， 标 准 差 为 o /n。 由 于 需要 用 s 估 计 o 的 数值 ， 于 是 t 分 布 的 标准 
分 的 算式 如 下 ; 


这 是 总 体 坊 值 ， 我 们 正在 未 其 置 
这 个 公式 和 过 的 计算 公 忌 只 - < 信 区 由 ， 
人 





我 们 只 要 代入 X、G 和 mn 就行 了 。 










让 我 们 看 看 如 何 将 以 上 结果 应 用 于 枝 帝 糖果 的 抽样 : 
抽样 中 共有 10 粒 糖 球 ， 其 中 x = 0.5 盘 司 ，s? = 0.09 。 
v 的 数值 是 多 少 ? T 值 又 是 多 少 ? 


忆 归 多 苦 
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动 动笔 解答 


蕊 
> 多 让 我 们 和 硅 看 如 何 将 以 上 结果 应 用 于 受 帝 糖果 的 抽样 : 
解 管 抽样 中 共有 10 粒 糖 球 ， 其 中 x = 0.5 盘 司 ，s? = 0.09。 

v 的 数值 是 多 少 ? T 值 又 是 多 少 ? . 
择 古 共有 10 耕 精 球 ，， 一 上 -1， 即 的 数值 为 9。 
TT 计算 如 下 ， 


又- 上 




















T= 








X~h 
V0.09/10 


XxX-p 





0.0949 


第 3 步 : 决定 置信 水 平 


那么 该 为 曼 帝 糖果 选用 哪个 置信 水 平 呢 ? 记 住 : 置信 水 平 指 的 是 你 希 
望 自己 对 “置信 区 间 包 含 总 体 统计 量 ”这 个 说 法 有 多 大 信心 ， 它 帮助 
我 们 指出 置信 区 间 应 该 有 多 宽 。 像 以 前 一 样 。 让 我 们 用 95% 作 为 总 体 
均值 的 置信 水 平 ， 于 是 总 体 均 值 位 于 置信 区 间 之 中 的 概率 为 0.95。 


对 应 于 95 笃 的 是 信 水 和 ， 
万 一 这 显 的 机 弟 生 0 





既然 已 经 有 了 轻信 和 水平， 我 们 就 能 进入 最 后 一 步 一 - 求 kL 的 置信 区 间 。 
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第 4 步 : 求 出 置信 上 下 限 


t 分 布 的 置信 上 下 限 的 算法 类 似 于 正 态 分 布 的 算法 ， 即 可 通过 下 式 进 
行 计算 : 


轩 个 奖 村 和 前 面 见 过 网 式 也 
了 2 PE 乙未 过 用 t 代 替 了 e， 
yn 
其 中 等 于 0.95， 这 是 因为 我 


P(-tSTSt)=0.95 上 外 芝 将 书 ?5% 杰 信和 区 同 ， 


我 们 可 以 通过 t 分 布 概率 表 求 出 t 值 。 


使 用 tf 分布 概率 表 


通过 t 分 布 概率 表 可 求 出 P(T > t) = p 中 的 t 值 。 在 我 们 的 实例 中 ， 

p = 0.025。 

为 了 求 出 t 值 ， 先 从 概率 表 中 查找 第 一 列 的 v 值 ， 再 查找 第 一 行 
的 p 值 ， 二 者 的 交点 处 即 为 t 值 。 例 如 ， 查 找 v =7 和 p=0.05， 可 得 
t=1.895。 


求 出 t 值 后 ， 就 能 求 置信 区 间 了 。 


7 和 0.05 相 雪 处 。 
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置信 区 间 练 习 


入 看 看 能 否 求 出 糖 球 平均 重量 的 95% 夫 信 区 间 。 样 本 包含 10 粒 糖 球 ， 
入 司 ，S? = 0.09。 


绒 习 


1. u 的 置信 区 间 等 于 (X -t+ si\Vn, X+ftsfwvmn)， 使 用 标准 概率 束 求 t 值 。 


2. 用 t 值 求 b 的 重信 区 间 。 
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我 们 为 什么 用 t+ 分布 解答 这 
个 问题 呢 ? 为 什么 系 用 正太 
分 布 ? 


在 用 小 样本 估计 总 体 方差 时 ，t 分 布 更 精确 。 

基于 小 样本 估计 e 有 一 个 问题 ， 即 可 能 无 法 精确 地 反映 总 体 
方差 的 真实 值 。 也 就 是 说 ， 我 们 需要 让 区 间 变 宽 ， 以 便 在 置 
信 区 间 中 留 出 一 些 误差 空间 

t 分 布 的 形状 随 着 vb 值 发 生变 化 ， 由 于 考虑 了 样本 的 大 小 ， 即 
使 o ?的 估计 精度 存在 各 种 足以 让 人 有 所 察觉 的 不 确定 性 ，t 
分 布 也 能 忽略 不 计 。 当 n 很 小 时 ，t 分 布 给 出 的 置信 区 间 比 正 
态 分 布 的 置信 区 间 更 宽 ， 这 使 它 更 适合 用 于 小 样本 。 


置信 和 区间 简明 算法 -+ 分 布 
下 面 是 有 关 t 分 布 的 使 用 时 机 以 及 .的 置信 区 间 的 简单 提示 。 


正 态 或 非 正 态 o ?未 知 ( 8 和 ) 
n 很 小 ( 小 于 30 ) xXx-t(v) —,X+ t(v)— 
x 为 样本 均值 n n 
Ss 为 样本 方差 


为 了 求 出 t(v)， 需 要 查找 t 分 布 概率 表 。 为 此 ， 用 v =n-1 和 你 确定 下 来 的 置信 水 
平 求 出 置信 区 间 。 
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练习 解答 


者 看 能 否 求 出 糖 球 平均 重量 的 95% 置 售 区间 。 样 本 包含 10 粒 糖 球 , 且 X = 0.5 
一 司 ，sS2 = 0.09。 


1. b 的 重信 区 间 等 于 (X ~t s/Vn, Xx + t sivn)， 使 用 标准 概率 变 求 t 值 。 


样 李 中 有 有 10 在 糖 球 ， 因 此 ，=9。 我 们 荐 浆 事 出 95%% 置 们 区 网。 即 需要 在 t 今 布 揽 府 总 中 查找 0.025， 
度 沟 9。 于 是 得 中 :t+ =2.262， 


2. 用 {t 值 求 5 的 重信 区 间 。 
我 们 将 X、t、s 和 Wh 代入 区 -ts 和 +ts/W) 击 置信 区 间 ， 得 到 ， 
区 -ts + te/Nn) = (0.5 - 2.262 x Y(0.097/10), 0.5 + 2.262 x Y(0.09770)) 
= (0.5 - 2.262 x 0.0949, 0.5 + 2.262 x 0.0949) 
= (0.5 - 0.215, 0.5 + 0.215) 


= (0.285, 0.715) 
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自信 地 猜测 


加 曼 帝 糖果 公司 发 现 他 们 的 装 糖 机 出 问题 了 。 他 们 抽取 了 30 台 机 器 作为 样本 ， 发 现 故 障 次 数 
镑 习 均值 是 15 。 请 为 每 月 故障 次 数 构建 一 个 99% 午 信 区 间 。 
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练习 解答 


县 帝 糖 果 公司 发 现 他 们 的 装 糖 机 出 问题 了 。 他 们 抽取 了 30 台 机 器 作为 样本 ， 发 现 故障 次 数 


甸 刁 
解答 


均值 是 15。 请 为 每 月 故障 次 数 构建 一 个 99% 秆 信 区 间 。 


每 月 故障 决 数 疹 合 治 松 分 币 模 型 ， 由 于 看 30 台 机 器 ， 我 们 可 以 用 ( 双 -cs/Ym,x+ os/ 如 ) 求 笠 亚 信 区 间 ， 
我 们 需要 刺 998 置 售 区间 ， 于 是 c = 2.58。 涪 拉 分布 凤 期 时 和 方 大 都 等 于 入 ， 国 此 X = 15 县 s* = 15。 


置信 区 同 计算 册 下 : 


(Xes/Nn, xX + es/Nn) = (15 -2.58 x N(15/30), 15 + 2.58 x N{15/30)) 
= (15 -2.58 x VN(15/30), 15 + 2.58 x N(15/30)) 


= {15- 2.58 x 0.707, 15 + 2.58 x 0.707) 


= (15— 1.824, 15 + 1.824) 


= (13.176, 16.824) 





世上 没有 俐 问题 


问 : 


答 ;， 当 总 体 符合 正 态 分 布 而 样本 很 小 时 ，X 符 合 t 分 
布 ， 这 时 需要 使 用 样本 数据 估计 总 体 方差。 


又 符合 t 分 布 吗 ? 


阅 ;一 般 说 来 ， 如 果 重信 水 平 发 生 改变 ， 对 置信 区 间 
会 有 何 影响 ? 


签 : 如果 至 信 水 平 下 降 ， 则 置信 区 间 变 窗 ; 如 果 轩 
信 水 平 提高 ， 则 下 信 区 间 变 寅 。 例 如 ， 对 于 一 组 相同 
的 教 据 ，95% 置 悦 区 间 将 比 99% 置 信 区 间 更 宪 。 
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问 ; ”如果 样 本 大 小 n 发 生 改变 ， 对 时 信 区 间 会 有 何 影响 ? 


答 : 如 果 n 减 小 ， 则 置信 区 间 变 宽 ; 如 果 n 增 大 ， 
则 置信 区 间 变 窜 。 
置信 区 间 的 表达 式 为 : 

统计 量 土 误差 范围 
其 中 ， 误差 范围 = cx 统计 重 的 标准 差 。 
统计 重 的 标准 差 取决 于 样本 的 大 小 一 n 越 大 ， 统 计量 
的 标准 差 越 小 ; 这 就 是 说 ，n 越 大 误差 范围 越 小 ，n 赵 
小 误差 范围 越 大 。 
一 般 说 来 ， 较 小 的 样本 形成 较 宽 的 置信 区 间 ， 较 大 的 祥 
本 形成 较 窄 的 置信 区 间 。 


置信 区 头 求 出 来 了 ! 

你 再 本 章 进 步 很 大 -一 所 以 现在 你 有 两 种 估计 总 体 统计 量 的 方法 了 。 
第 一 种 估计 方法 是 使 用 点 估计 量 。 点 估计 量 方法 可 用 于 估计 总 体 
统计 量 的 精确 数值 ， 是 根据 样本 数据 有 可 能 做 出 的 最 好 猜测 。 

另 一 种 估计 方法 是 使 用 总 体 统计 量 的 置信 区 间 。 这 个 方法 得 到 的 
并 非 总 体 统计 量 的 精确 估计 ， 而 是 求 出 总 体 统计 量 的 一 个 有 较 高 
可 信和 度 的 数值 范围 。 









你 真 了 不 起 ! 我 会 告诉 糖果 店 糖 球 重 量 
均值 的 置信 区 间 ， 他们 就 想 知 道 这 个 ， 
他 们 会 向 绒 客 推销 更 多 糖 球 ， 那 样 利 泣 
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米 
研究 证 据 #4 






我 想 你 说 过 这 
些 是 真正 的 马 . 


他 人 的 言论 未 必 句 句 真实 可 信 。 

问题 是 如 何 判断 他 人 的 言论 何 时 真 ， 何 时 假 ? 假设 检验 为 你 提供 了 一 种 方法 一 利 
用 样本 检验 各 种 统计 断言 是 否 可 能 属实 。 通 过 假设 检验 可 以 权衡 证 据 ， 检 验 极限 结 
果 一 - 是 纯 属 巧合 ， 还 是 存在 其 他 内 在 根据 ? 让 我 们 一 起 阅读 本 章 ， 看 看 如 何 利用 
假设 检验 证 实 或 打消 你 内 心 深 处 的 疑虑 。 


治疗 打 妈 的 灵丹妙药 ? 


有 让 你 汉 注 打 采 ? 
快 让 灵丹妙药 “ 知 克 ”来 帮忙 。 
乒 克 : 患者 2 周 内 
治 息 率 90%。 





统计 孝 新 上 市 的 神奇 药品 
统计 邦 头号 制药 公司 生产 了 一 种 治疗 打 解 的 新 药物 。 被 打 呼 只 
折磨 不 堪 的 患者 纷纷 赶 往 医 院 ， 指 望 能 得 到 睡眠 救星 


制药 公司 断言 他 们 的 神 药 能 在 两 周 内 治愈 90% 的 患者 ， 对 于 深 
受 打 和 解困 扰 的 人 来 说 ， 这 可 是 个 天 大 的 好 消息 。 问 题 是 ， 并 非 
人 人 都 信服 这 个 断言 
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我 可 不 相信 他 们 说 的 是 真 的 . 
要 是 果真 由 此 ， 我 手头 就 有 
更 多 患者 能 够 治 钝 . 


统计 邦 外 科 诊 所 的 医生 给 病人 开 了 千克 ,但 她 对 结果 感到 失望 。 
她 决定 自行 对 药物 进行 试验 。 

她 随机 抽取 了 15 位 鼻 艇 患者 ， 对 这 些 患者 实施 为 期 2 周 的 身 克 疗 
法 。 两 周 后 ， 她 请 这 些 患 者 来 医院 复诊 ， 看 他 们 是 否 不 再 打 解 。 

车 艺 结果 如 下 : 









时 ?| 是 | 到 | 
EE i 





如 果 药 物 能 治愈 90% 的 鼻 丢 患者 ， 那 么 你 会 期 望 这 个 包含 15 名 
自身 患者 的 抽样 中 出 现 几 位 治愈 者 ? 你 认为 这 符合 什么 分 布 ? 
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BS 如 果 药 物 能 治 意 909% 的 鼻 刷 患者， 那么 你 会 期 望 这 个 包含 15 名 


解 带 鼻 身 患者 的 抽样 中 出 现 几 位 治 念 者 ? 你 认为 这 符合 什么 分 布 ? 








15 轰 90% 是 13.5， 国 此 你 可 以 期 四 论 钝 14 名 患者 ,而 星 生 网 抽样 中 内 有 11 名 患者 治 傅 ， 这 比 期 再 的 结 末 
得 多 。 


由 于 斌 验 决 数 一 定 ， 且 医生 关注 的 征 治 爷 人 数 ， 因 此 ， 涂 爷 人数 符 合 二 项 今 布 。 几 果 用 X 囊 示 治 合 人 数 ， 则 
义 一 马 (15, 0.9) 







问题 出 在 哪里 ? 


下 面 的 概率 分 布 代表 制药 公司 所 宣称 的 能 够 通过 鼻 册 新 药 治 您 的 人 数 。 


Ea 
和 

< 
他 


治 候 的 意 者 数 - 
这 是 实际 用 秆 志 治 全 Sa 
的 记者 数 ， 


y 


10 11 42 13 14 145 x 





医生 抽样 中 通过 舌 克 治愈 的 患者 数 实际 上 比 你 所 期 望 的 治愈 人 
数 小 得 多 。 按 照 制药 公司 的 说 法 ， 你 会 期 望 治愈 14 名 患者 ， 但 
其 实 只 治愈 了 11 名 患者 。 


为 什么 会 出 现 这 样 的 差别 呢 ? 
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这 是 否 说 明 制 药 公司 在 撒谎 ? 
药物 地 应 该 能 够 治愈 更 多 的 竣 
人 才 对 ? 


制药 公司 可 能 不 是 存心 撒谎 ， 但 他 们 的 断言 可 能 具有 误导 性 。 

制药 公司 的 检验 可 能 有 人 缺陷， 进而 使 得 身 克 的 断言 可 能 存在 误导 性 一 由 
于 玖 忽 大 意 ， 他 们 对 告 克 进行 的 检验 可 能 有 缺陷 ,或 者 说 有 偏差 .以 致 于 
对 总 体 做 出 了 不 准确 的 预测 . 


如 果 身 克 的 治愈 率 实 际 上 低 于 90%， 那 么 就 能 解释 为 什么 样本 中 只 有 11 人 
治愈 。 










可 是 我 们 确实 有 把 握 是 制药 公司 
出 了 孝 错 吗 ? 说 不 定 是 那 位 医生 
倒 零 呢 ? 


制药 公司 的 断言 实际 上 可 能 是 准确 的 。 

如 果 制 药 公 司 没有 出 差错 ， 那 么 很 可 能 是 那 位 医生 的 抽样 患者 无 法 代表 整 
个 鼻 身 患者 总 体 。 很 有 可 能 鼻 身 药物 确实 治愈 了 90% 的 患者 ， 医 生 却 正好 
抽 中 了 不 治愈 人 数 比例 较 高 的 样本 。 也 就 是 说 ， 医 生 的 样本 可 能 存在 某 种 
偏 倚 ， 要 不 然 就 是 因为 样本 中 的 患者 数目 较 少 。 


下 荔 世 及 


你 认为 我 们 该 怎么 办 ? 我 们 该 相信 谁 ? 是 相信 和 制药 公司 的 断言 ， 
还 是 相信 医生 的 质疑 ? 
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假设 检验 过 程 


纵 观 全 局 


我 们 该 如 何 裁决 医生 与 制药 公司 之 间 的 矛盾 说 法 ?让 我 们 纵 观 全 局 ， 看 
看 需要 做 点 什么 。 

我 们 可 以 对 制药 公司 的 断言 进行 检验 ， 以 期 裁决 制药 公司 和 医生 的 矛盾 
之 说 。 即 ,我 们 权 且 相信 和 制药 公司 的 断言 ， 可 是 一 旦 出 现 强 有 力 的 反 驶 
证 据 ， 我 们 就 改 为 站 到 医生 一 边 。 
具体 做 法 : 





、 生 渐 断 二 


当 第 证 电 


看 看 我 们 需要 哪些 证 据 才 可 以 了 定 制 若 
公司 的 断言 ， 并 把 所 需 鬼 证据 和 我 们 手 
关 观 有 的 证 据 进行 比较 ， 方 法 是 ， 千 仿 
设 制药 公司 的 断言 属实 ， 状 后 看 看 医生 
得 到 的 结果 是 否 有 误 ， 


作出 闫 和 


根据 证 据 ， 接受 或 否定 
制 若 公 司 的 断言 ， 





通常 以 上 过 程 称 为 假设 检验 一 做 出 假设 或 断言 ， 对 照 证 据 进行 检 
验 。 让 我 们 看 看 假设 检验 的 一 般 过 程 。 
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假设 检验 六 步 又 


下 面 是 假设 检验 的 几 个 粗略 步 又， 我们 将 在 后 面 几 页 详 加 说 明 。 


即 我 公 要 对 其 进 


行 试验 的 断言. - 仿 先 
© 


我 们 需要 继 用 人 


种 确定 性 水 平 ， 广 全 


© 
© 
© 





确定 要 进行 检验 的 假设 

选择 检验 统计 量 

确定 用 于 做 决策 的 拒绝 城 

求 出 检验 统计 量 的 p 值 

查看 样本 结果 媚 否 位 于 拒绝 域内 


作出 决策 










要 这 人 么 多 手续 
王 蚂 ? 可 能 上 
天 谋 . 


各 们 寅 要 选取 能 旭 有 放 地 对 新 言 道生 
检验 纳入 计量 ， 


启 在 假 灾 新 证 为 铺 网 刁 


前 之 要 了 
各 们 常委 采 的 可 信 程度 ， 


况 下 ， 才 们 的 庶 葵 千 


全、 接着 需要 了 解 襄 验 结 果 是 
各 位 于 确定 性 限 秆 范围 中 . 


我 们 需要 确保 对 药品 断言 进行 正确 的 检验 ， 然 后 才能 加 以 否定 。 
通过 这 些 步 又 ， 我 们 明白 : 在 对 双方 进行 公正 的 裁决 ， 同 时 将 对 
断言 进行 公正 的 试验 。 我 们 不 想 在 没有 足够 证 据 反 驳 制 药 厂 断言 
的 情况 下 拒绝 该 断言 、 这 说 明 ， 需 要 通过 某 种 方式 确定 所 谓 “ 充 
分 证 据 ” 应 该 包含 哪些 内 容 。 
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原 假 设 与 备 择 假设 


4 你 在 
第 1 步 : 确定 假设 进行 一 zj 和 人 
i We -> 这 一 步 选择 检验 统计 是 

让 我 们 先 执 行 假设 检验 第 1 步 ， 了 解 要 进行 检验 的 主要 断言 ， 该 断言 被 称 A 
为 假设 。 

求 出 检验 统计 最 的 p 值 
制药 公司 断言 过 和 人 本 结果 和 天 位 于 和 
根据 制药 公司 的 断言 ， 射 克 能 在 2 周 内 治愈 90% 的 患者 。 除 非 我 们 有 充分 证 作出 决策 





据 进 行 反驳 ， 和 否则 就 要 接受 这 个 结论 。 


我 们 所 检验 的 这 个 断言 被 称 为 原 假设 ， 以 He 表示 ， 除 非 我 们 有 充分 证 据 进 
行 反 驶 ， 否则 就 要 接受 这 个 断言 。 











我 是 原 假 设 ， 是 默认 的 


原 假设 即 你 要 对 其 进行 检验 的 断言 ， 除 结论 . 要 是 你 认为 我 错 


非 有 尽 够 揭 证 据 进行 反驳 ， 否 则 你 将 接 0 O 〇 飞 了 , 请 给 出 证 据 ， 
受 这 个 断言 Ws H。 
新 克 的 原 假 设 是 什么 ? 


射 克 的 原 假 设 即 制药 公司 的 断言 : 射 克 能 在 两 周 内 治愈 90% 的 患者 。 除 非 
我 们 有 足够 的 证 据 进行 反驳 ， 和 否则 应 认同 这 个 断言 。 
我 们 需要 检验 鼻 射 药物 是 否 至 少 能 治愈 90% 的 患者 ， 因 此 原 假设 为 : p = 90%。 


这 就 是 散 克 试验 的 原 
设 . np=o9 












除非 能 举 出 反 发 鬼 证 据 ， 
否则 你 必须 认同 我 能 治 
人 钝 90% 患 者 的 结论 . 
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周 付 么 做 备 选 假设 ? 


前 面 讲 过 我 们 即将 检验 的 断言 一 原 假设 ， 可 如 果 这 个 假设 不 为 真 该 怎么 
办 ? 用 什么 做 备 选 假设 ? 


医生 的 见解 


医生 认为 制药 公司 对 疗效 的 断言 过 于 理想 ， 反 而 显得 不 真实 一 她 认为 治 
愈 率 不 会 达到 90%， 低 于 90% 的 可 能 性 更 大 。 


与 原 假设 对 立 的 断言 被 称 为 备 择 很 设 ， 用 Hi 表示 。 如 果 有 足够 的 证 据 拒绝 
He， 我们 就 接受 Hi。 






我 是 备 择 仍 设 ， 史 果 H。 
让 你 类 望 ， 你 就 得 选择 被 
当 作 “ 备 胎 ”的 我 了 ， 






备 择 假 设 即 在 把 绝 H 之 后 将 接受 护 
另 一 个 断言 人 人 了 0 0 
1 







新 克 的 备 挣 假设 


千克 的 备 择 假 设 就 是 在 证 实 制 药 公 司 的 断言 有 假 之 后 要 认同 的 另 一 断言 。 
如 果 有 足够 的 证 据 反 驶 制药 公司 的 断言 ， 那 么 有 可 能 医生 的 断言 是 对 的 。 


医生 认为 责 克 治愈 的 患者 少 于 90%， 即 备 择 假 设 为 : p < 90%。 


这 就 是 前 克 试 验 的 
备 择 假设 . 一 仿 H: p<0.9 


既然 我 们 已 经 为 币 克 的 假设 检验 确定 了 原 假设 和 备 择 假设 ,就 可 以 进行 第 
2 步 了 。 
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世上 没有 人 筷 问 题 


世上 没有 盆 问 题 


奖 :上 既然 我 们 假设 原 假设 是 真实 的 ， 为 什 
么 后 来 又 要 找 证 据 证 明 它 是 错误 的 呢 ? 


答 : 进行 假设 检验 实际 上 是 对 假设 检验 
的 断言 进行 试验 ， 你 对 假设 保持 怀疑 随后 ， 
如 果 有 足够 的 拒 铝 证 据 ， 则 进行 拒绝 。 这 有 
点 儿 习 把 四 犯 带 到 法 官 面前 接受 审判 。 只 有 
在 有 足够 的 证 据 证 明 因 犯 有 罪 时 ， 才 能 进行 
宣判 。 


内 : 诛 假 设 和 备 择 假设 必须 穷 举 吗 ? 二 者 
是 否 应 该 涵盖 所 有 可 能 的 结果 ? 
答 : 不 用 。 例 如 ， 我 们 的 原 假 设 是 P=0.9， 


备 择 假设 是 p<0.9， 二 者 都 不 必 考 虑 p>0.9。 


间 :这 个 假设 检验 的 样本 是 不 是 太 小 了 ? 


签 。 即使 祥 本 很 小 ， 我 们 仍 热 能 够 做 候 
设 检验 ， 这 都 取决 子 你 所 使 用 的 检验 统计 量 ， 
下 面 将 讲 到 这 个 问题 。 


阅 :这 么 说 假设 检验 就 是 用 来 证 明 断 言 是 
否 正确 的 ? 


人 答 : 假设 检验 无 法 给 出 绝对 的 证 明 ， 体 
只 能 在 假定 原 假 设 为 真 的 前 提 下 ， 通 过 假设 
检验 了 解 观察 结果 到 底 有 多 可 知 。 如 果 观 察 
结果 极 不 可 能 发 生 ， 就 会 成 为 证 明 原 假设 为 
假 的 证 气 。 


进行 委 设 检验 时 ， 你 假定 原 假设 为 真 ， 如 果 有 足够 的 证 据 反 驭 
原 息 设 ， 则 拒绝 原 息 设 ， 接 受 备 择 假 设 。 


530 深入浅出 统计 学 


研究 证 据 





你 在 


第 2 步 : 选择 检验 统计 量 
进行 “一 医生 


既然 已 经 完全 确定 了 要 进行 检验 的 内 容 ， 接 着 就 需要 通过 某 些 手段 这 一 步 
进行 检验 -一 这 可 以 借助 检验 统计 量 实现 。 


十 用 于 做 决策 的 拒绝 域 


“检验 统计 量 ” 即 用 于 对 假设 进行 检验 的 统计 量 ， 是 与 该 检验 关系 
最 为 密切 的 统计 量 。 


靳 克 的 检验 统计 量 是 哪 一 个 ? 


我 们 做 假设 检验 的 目的 是 检验 艇 克 是 否 能 治愈 90% 以 上 的 患者 。 为 
此 ， 可 以 根据 制药 公司 的 说 法 查看 概率 分 布 ， 看 看 抽样 中 的 成 功 次 
数 是 否 显著 


如 果 用 X 表 示 样 本 人 数 ， 就 可 以 将 X 作 为 检验 统计 量 。 样 本 中 共有 15 
名 上 患者， 根据 制药 公司 的 说 法 ， 成 功 概率 为 0.9。 由 于 X 符 合 二 项 分 
布 ， 于 是 检验 统计 量 实际 上 符合 : 
这 是 我 们 的 假 设 检 验 的 


,了 7X~B(15,0.9) 入 维 售 计量. 


我 们 在 524 页 得 出 了 












过 个 统计 量 . 
我 糊涂 了 . 为 什么 我 们 
说 成 功 概率 是 0.9? 我 们 
还 不 知道 是 多 少 呢 . 
我 们 根据 原 假设 Ho 选择 检验 统计 量 。 
我 们 需要 检验 是 否 有 充足 的 证 据 反 驶 原 假设 。 办 法 是 : 首先 假设 Ho 为 
真 ， 然 后 寻找 不 利于 Ho 的 证 据 。 在 针对 身 克 的 检验 中 ， 我 们 假设 治愈 


概率 为 0.9 一 除非 有 有 力 证 据 证 明 这 不 成 立 。 

为 此 ， 我 们 假定 治愈 概率 为 0.9， 看 看 得 出 观察 结果 的 可 能 性 有 多 大 。 
也 就 是 说 ， 取 样本 结果 ， 然 后 计算 发 生 这 个 结果 的 概率 -一 我 们 通过 求 
拒绝 域 实现 这 个 目标 。 
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求解 拒绝 域 


第 3 步 : 确定 拒绝 域 
假设 检验 的 拒绝 域 是 一 组 数值 ， 这 组 数值 给 出 反 驱 原 假设 的 最 极端 证 据 。 。 你 在 


让 我 们 再 看 看 医生 的 样本 ， 以 便 了 解 拒绝 域 的 使 用 方法 。 如 果 治 愈 人 数 为 这 一 步 
90% 或 90% 以 上 ， 这 就 与 制药 公司 的 断言 吻合 了 。 随 着 治愈 人 数 下 降 ， 制 
药 公 司 的 断言 为 真 的 可 能 性 越 来 越 小 。 


下 面 是 概率 分 布 : 









求 出 检验 统计 作 的 p 值 
咨 缀 样本 结 梭 缅 否 位 于 拒 
雹 域内 


如 果 样 东 中 明和 患者 已 有 90% 治 合 
纯 可 以 合情合理 地 证 实 制 茵 公司 
的 断言 是 正确 的 ， | 


治 钝 的 人 数 越 少 ， 制 药 公 司 的 J 


断言 有 误 的 可 能 性 盐 大 。 
和 一 | | 


10 11 12 13 14 15 


何 时 能 够 拒绝 制药 公司 的 断言 ? 


样本 中 得 到 成 功 治愈 的 患者 人 数 越 少 ， 可 以 用 于 反驳 制药 公司 断言 的 证 据 
就 越 有 力 。 问 题 是 : 这 些 证 据 的 强度 达到 多 大 时 ， 我 们 能 够 坚决 地 拒绝 
原 假设 ? -一 到 什么 程度 候 能 够 拒绝 “ 铸 克 治愈 90% 鼻 钥 患 者 ”这 个 断言 ? 


我 们 需要 通过 某 种 方法 指出 何 时 能 够 合理 地 拒绝 原 假设 一 - 指定 一 个 拒 
绝 域 即 可 实现 这 一 目的 。 如 果 鼻 艇 患者 的 治愈 人 数位 于 拒绝 域 以 内 ,我 
们 就 说 有 足够 的 证 据 可 以 反驳 原 假设 ; 如 果 鼻 艇 患者 的 治愈 人 数位 于 拒 
绝 域 以 外 ， 我 们 就 承认 没有 足够 的 证 据 可 以 反驳 原 假设 ， 并 接受 制药 公 
司 的 断言 。 我 们 把 拒绝 域 的 分 界 点 称 为 “c” 一 一 临界 值 。 


如 何 选择 临界 值 ? 

六 全 区 城 以 
怒 果 租 均 治 治 钨 的 趾 者 人 数 区 在 这“ 
则 庆 拉 避 地 全 的 虽 者 人 雪 区 在 这 个 拒 弛 城 以 才 ， 全 风 要 新 和 们 设 有 汉人 的 证 据 知 实 市 和 公司 
Fo 人 > 否定 制药 公司 拘 断 言 Ha 我 界 值 向 ， ew 慌 们 现在 只 是 在 查看 是 否 有 证 

给 训 是 p<0.9， 因 此 我 们 在 这 个 区 同 的 断言 Ho。 
中 寻找 证 据 . y 据 证 明 p < 0.9， 
ee actianc -和 soonhaaliaoec 
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为 求 拒 绝 域 ， 先 足 显 著 性 水 乎 

为 了 求 出 假设 检验 的 拒绝 域 ， 首 先 需 要 定 下 “显著 性 水 平 ”。 检 验 
的 显著 性 水 平 所 量度 的 是 一 种 愿望 ， 即 : 希望 在 样本 结果 的 不 可 能 
程度 达到 多 大 时 ， 就 拒绝 原 假设 H。。 像 置信 区 间 的 置信 水 平一 样 ， 
显著 性 水 平 以 百分数 表示 。 





例如 ， 假 设 我 们 想 以 5% 为 显著 性 水 平 检验 制药 公司 的 断言 ， 这 说 明 
我 们 选取 的 拒绝 域 应 使 得 “ 鼻 身 患者 治愈 人 数 小 于 c” 的 概率 小 于 
0.05， 即 概率 分 布 最低 端 的 5% 部 分 。 


几 果 斯 克 治 念 的 可 其 名 者 的 数目 苗 在 





拒绝 域 必 内 ， 则 我 们 将 拒绝 原 假 设 . 娩 果 Ho 为 真 ， 则 对 于 “ 治 钨 的 二 艇 患者 欧 数 目 会 
| 蓝 在 这 个 区 间 里 ”这 个 判断 ， 我 们 有 95 和 的 把 所 
拒绝 域 L 
ne 
.> 
5% - 95% 


显著 性 水 平 通常 用 希腊 字母 a 表示 。a 越 小 ， 为 了 拒绝 Ho。， 样 本 结 
果 需 要 达到 的 不 可 能 程度 越 高 。 


我 们 该 使 用 多 高 的 显著 性 水 乎 ? 
让 我 们 在 假设 检验 中 使 用 5% 的 显著 性 水 平 。 即 ， 如 果 样 本 中 


的 治愈 患者 的 数目 落 在 概率 分 布 的 最 低 5% 范 围 内 ， 我 们 将 否 Ps 重 要 统计 量 


定制 药 公司 的 断言 。 如 果 治 愈 的 鼻 解 患者 的 数目 落 在 概率 分 | ey ， 


NA Cr 显著 性 水 平 

如 果 我 们 用 X 表 示 治 愈 的 鼻 慎 患者 的 数目 ， 则 我 们 将 拒绝 域 显著 性 水 平 用 a 表示 。 它 

定义 为 能 令 下 列 不 等 式 成 立 的 一 些 数 值 : 表明 你 希望 在 观察 结果 的 
p(X<c)<a a 

其 中 





a = 5% 
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拒绝 域 细 细 看 


碟 绝 城 细 细 逢 


在 构建 检验 的 拒绝 域 时 ， 还 需要 明白 一 件 事 : 所 构建 的 是 单 尾 检验 还 是 双 尾 
检验 。 让 我 们 看 看 这 两 者 之 间 的 差别 ， 以 及 它们 对 拒绝 域 有 什么 影响 。 






















单 尾 检 验 


单 尾 检验 即 检验 的 拒绝 域 落 在 可 能 的 数据 集 的 一 侧 ， 你 先 
a i 
择 检 验 水 平一 以 a 表示， 然后 确保 拒绝 域 以 相应 的 概率 2 > 
= , Or C 100% - 
反映 这 个 水 平 。 尾 部 可 以 是 可 能 数据 集 的 左 侧 或 右 侧 ， 具 
体 用 哪 一 侧 取 决 于 备 择 假设 Hi。 过 全 网 的 是 左 尾 ， 


a 水 平 的 单 尾 检验 


如 果 备 择 假设 包含 一 个 < 符号 ， 则 使 用 左 尾 ， 此 时 拒绝 域 位 
于 数据 的 低 端 加 
流 里 鬼 抢 绝 城 位 于 右 尾 
如 果 备 择 假设 包含 一 个 > 符号 ， 则 使 用 右 尾 ， 此 时 拒绝 域 位 pp 
于 数据 的 高 端 
可 一 
% - a 
我 们 对 解 克 使 用 的 是 单 尾 检验 ， 由 于 备 择 假设 为 p < 0.9， 因 Se 


此 拒绝 域 位 于 左 尾 。 


交尾 检验 


双 尾 检验 即 拒绝 域 一 分 为 二 位 于 数据 集 的 两 侧 ， 你 选择 检验 
这 是 双 尾 检验 .拒绝 域 一 分 
水 平 a ， 然 后 将 拒绝 域 一 分 为 二 ， 并 确保 整个 拒绝 域 以 相应 为 二 位 于 两 侧 的 尾部 
概率 反映 这 个 检验 水 平 。 两 侧 各 占 a /2， 因 此 总 和 为 a。 二 二 
Ci Cc, 


判断 是 否 需要 使 用 双 尾 检验 的 方法 是 : 查看 备 择 假设 H;， 志 二 y+ 
如 果 Hi 包 含 一 个 不 等 号 二， 则 需要 使 用 双 尾 检验 ， 这 是 因 ”at/2 100% -a ar/2 
为 你 要 找 出 参数 的 变化 ， 而 不 是 增 减 。 



















对 于 艇 克 ， 如 果 备 择 假设 为 p 和 0.9， 则 我 们 应 使 用 双 尾 检 
验 ， 我们 应 该 查看 治愈 的 人 数 是 否 显 著 多 于 或 显著 少 于 
90%。 
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讲 过 拒绝 域 之 后 ,我 们 就 能 进入 第 4 步 : 求 出 P 值 。 

P 值 即 某 个 小 于 或 者 等 于 拒绝 域 方 向 上 的 一 个 样本 数值 的 概率 。 具 体 求 

法 是 利用 样本 进行 计算 ， 然 后 判定 样本 结果 是 否 落 在 假设 检验 的 拒绝 
域 以 内 。 也 就 是 说 ， 我 们 通过 P 值 确定 是 否 该 拒绝 原 假设 。 


如 和 何 求 p 值 ? 


具体 用 哪 种 方法 求 p 值 取决 于 拒绝 域 和 检验 统计 量 。 对 于 生 克 检验 来 说 ， 
治 僵 人 数 为 11 人， 而 拒绝 域 位 于 分 布 的 低 端 ， 于 是 P 值 为 P(X<11)， 其 中 
X 为 样本 中 的 治愈 人 数 的 分 布 。 


由 于 检验 的 显著 性 水 平 为 5%， 说 明 如 果 P{X<ll) 小 于 0.05、 则 数值 11 落 在 
拒绝 域 中 ， 这 时 我 们 可 以 拒绝 原 假设 。 


蔽 明 数值 11 共 在 拒绝 域 中 一 我 们 


忆 和 世芳 符 


几 果 P(XS11) 小 于 0.05 ， 
可 以 拒绝 原 假 设 He 











我 们 在 第 2 步 中 了 解 到 X ~ B(15, 0.9)。 那 么 P(X < 11) 等 于 多 少 ? 
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我 们 在 第 2 步 中 了 解 到 X ~ B(15, 0.9)。 那 么 P(X < 11) 等 于 多 少 ? 


P(X<11) =1-P(XZ>12) ;Css=1 也 等 于 0.10， 因 此 


cz 需 计 算 0.95 
1 (SOX 0 X09 4 SO AOI 0 十 SO 0 x09" 十 1099 


1 - (0.1285 + 0.2669 + 0.3432 + 0.2059) 


1 ~ 0.9445 





0.0555 


我 们 已 经 求 得 p 值 


为 了 求 得 假设 检验 的 P 值 ， 我 们 必须 求 出 P(X<11)， 即 P 值 等 于 0.0555。 












P 购 计算 方法 冶 终 未 变 
吗 ? 如 果 拒 绝 域 在 高 
端 呢 ? 


p 值 即 为 取得 样本 中 的 各 种 结果 或 取得 拒绝 域 方向 上 的 某 些 更 为 极 
端的 结果 的 概率 。 
在 刷 克 假设 检验 中 ， 拒 绝 域 位 于 概率 分 布 的 左 尾 。 为 了 了 解 “治愈 11 位 
患者 ”这 个 结果 是 否 位 于 拒绝 域内 ， 我 们 计算 了 P(X<11)， 因 为 这 正 是 
取得 位 于 左 尾 方向 上 并 至 少 以 样本 结果 为 极 值 的 数值 的 概率 

我 们 起 了 解 是 否 “ 治 钝 11 位 患者 ” 这 个 结果 位 于 这 个 拒绝 
城中 ， 因 此 用 P(X 11) 进 行 估计 。 








cc > 


0.05 0.95 
相反 ， 假 如 我 们 的 拒绝 域 位 于 概率 分 布 的 右 尾 ， 我 们 就 需要 求 P(X>11)。 
我 们 应 该 将 更 为 极端 的 一 些 数值 视 为 大 于 11 的 极 值 ， 因 为 这 些 数 值 本 来 就 
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第 9 步 : 样本 结果 位 于 拒绝 域 中 咀 ? 


我 们 已 经 求 出 了 P 值 ， 可 以 用 它 检查 我 们 的 样本 结果 是 否 落 在 拒绝 域内 
如 果 的 确 如 此 ， 则 我 们 就 有 足够 的 证 据 和 否定 制药 公司 的 断言 


我 们 的 拒绝 域 位 于 概率 分 布 的 左 尾 ， 所 用 显著 性 水 平 为 5%。 这 意味 着 ， 
如 果 P 值 小 于 0.05， 就 能 拒绝 原 假设 。 由 于 我 们 的 P 值 为 0.0555， 因 此 样本 
中 用 和 解 克 治愈 的 患者 数 不 在 拒绝 域内 


5% 95% 


第 6 步 : 作出 决策 


我 们 已 经 进入 假设 检验 的 最 后 一 步 : 决定 接受 原 假设 ， 还 是 拒绝 原 假 设 而 
改 用 备 择 假设 。 


因为 假设 检验 的 P 值 落 在 检验 的 拒绝 域 以 外 ， 因 此 ， 没 有 充分 的 证 据 可 以 
拒绝 原 假设 。 所 以 : 


我 们 接受 制药 公司 的 断言 


0 





选择 检验 统计 量 


确定 用 于 做 决策 的 拒绝 域 


进行 “一 一 一 > ET 
达 一 步 绝 域内 





确定 要 进行 检验 的 假设 
选择 检验 统计 量 
确定 用 于 做 决策 的 拒绝 域 


求 出 检验 统计 量 的 p 值 


查看 样本 结果 是 否 位 于 拒 
绝 域 内 
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假设 检验 总 结 


我 们 前 面 做 了 哪些 工作 ? 
让 我 们 总 结 一 下 前 面 的 工作 。 


首先 ， 我 们 取 用 制药 公司 的 断言 一 医生 对 此 断言 有 疑虑 。 我 们 将 这 些 断 
言 作为 假设 检验 的 基础 ， 形 成 一 个 原 假设 : 患者 的 治愈 概率 为 0.9， 随 后 
将 这 个 概率 应 用 于 医生 样本 的 人 数 。 


然后 ,我 们 决定 以 5% 的 检验 水 平 进行 检验 ， 检 验 中 使 用 了 医生 的 样本 治 
愈 率 。 我 们 计算 了 有 11 位 或 11 位 以 下 患者 得 到 治愈 的 概率 ， 然 后 检查 这 个 
概率 是 否 低 于 5%， 也 就 是 0.05。 换 句 话说 ， 我 们 计算 了 等 于 这 个 极 值 或 比 
这 个 极 值 更 极端 的 数值 的 概率 。 

最 后 ， 我 们 求 出 : 当 检 验 水 平 为 5% 时 ， 没 有 足够 的 证 据 可 以 否定 制药 公 
司 的 断言 。 










但 这 并 莫 医 生 想 要 的 
和 结果。 我们 处 能 用 别 的 
水 平 进行 检验 吗 ? 


一 旦 确定 了 检验 的 显著 性 水 平 ， 就 无 法 改变 。 

检验 必须 绝对 公正 。 因 此 在 研究 实际 拥有 的 证 据 之 前 ， 必 须根 据 所 
需要 的 证 据 水 平 决定 所 需要 的 检验 水 平 。 

如 果 打 算 先 看 证 据 是 否 充 分 ， 再 确定 检验 水 平 ， 这 就 会 影响 判定 一 
你 可 能 会 忍 不 住 按照 心中 想 要 的 结果 选 定 一 个 特定 的 检验 级 别 ， 这 
就 会 令 检 验 结果 发 生 偏 倚 ， 于 是 有 可 能 做 出 错误 决策 。 
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进行 假设 检验 即 选 定 一 个 断言 ， 然 后 借助 统计 证 
据 对 其 进行 检验 。 


所 检验 的 断言 被 称 为 原 假设 ， 用 He 表示。 除非 有 
有 力 的 证 据 证 明 断 言 不 正确 ， 否 则 就 接受 断言 。 


备 择 假设 即 在 有 充分 证 据 拒 绝 原 假设 Ho 的 情况 下 
将 接受 的 假设 ， 用 H, 表 示 。 


检验 统计 量 即 用 于 对 假设 进行 检验 的 统计 量 ， 是 
与 检验 具有 最 密切 关系 的 统计 量 。 选 择 检 验 统计 
量 的 时 候 ， 你 假定 Ho 为 真 。 


显著 性 水 平 用 & 表示 ， 它 表示 你 希望 在 观察 结果 
的 不 可 能 程度 达到 多 大 时 拒绝 Hu。 





研究 证 据 


拒绝 域 为 一 组 数值 ， 代 表 可 用 于 否定 原 假设 的 最 
极端 证 据 。 选 择 拒绝 域 时 ， 需 考虑 显著 性 水 平 ， 
还 要 考虑 用 单 尾 还 是 双 尾 进 行 检验 。 


单 尾 检验 的 拒绝 域 位 于 数据 的 左 侧 或 右 人 出 ， 双 尾 
检验 的 数据 一 分 为 二 位 于 数 距 的 两 人 出。 可 根据 备 
择 假 没 选择 尾部 。 


P 值 即 取 得 样本 结果 或 取得 拒绝 域 方向 上 的 更 极 
端 结果 的 概率 。 


如 果 P 值 位 于 拒绝 域 中 ， 则 有 充足 的 理由 拒绝 原 
假设 ; 如 果 P 值 位 于 拒绝 域 以 外 ， 则 没有 充足 的 
证 据 。 


世上 没有 俐 问题 


问 : 


答 : 这 完全 取决 于 你 希望 以 多 大 力度 的 证 据 拒 绝 原 
假设 。 你 越 想 增 大 证 据 力 度 ， 显 著 性 水 平 必须 越 小 。 


最 常用 的 显著 性 水 平 为 5%， 不 过 有 时 也 会 用 到 1% 的 显 
著 性 水 平 。 用 1% 的 水 平 进 行 窒 验 意 味 着 证 据 力 度 大 于 
5% 的 水 平 。 


一 般 可 用 哪 种 显著 性 水 平 进行 检验 ? 










钛 有 疑虑 。 
我 想 知 道 ， 如 果 用 一 
个 大 一 点 几 取 样本 会 
怎么 样 ? 










问 ， 


处 吗 ? 


等 : 有 ， 有 不 少 共 同 之 处 。 在 为 总 体 参数 构建 置信 
区 间 时 ， 你 希望 对 “总 体 和 参数 位 于 两 个 限 值 之 闻 ” 这 一 
结果 具有 一 定 的 置信 度 ， 例 如 ， 如 果 置 局 水 平 为 95%， 
虽说 明 总 体 参 数位 于 两 个 限 值 之 间 的 概率 为 0.95。 


显著 性 水 平反 映 了 教 值 将 位 于 某 个 限 值 以 外 的 概率 。 
例如 显著 性 水 平 为 5% 意 味 荐 拒绝 域 的 概率 必须 为 0.05。 


显著 性 水 平 与 置信 区 间 的 置信 水 平 有 共同 之 
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假设 检验 新 样本 


如 果 样 本 增 大 会 怎么 样 ? 


前 面 讲 过 ， 医 生 仅 以 15 人 为 样本 进行 了 试验 ， 以 这 个 样本 为 依据 得 出 
的 证 据 不 足以 否定 制药 公司 的 断言 。 


有 可 能 样本 不 够 大 ， 这 才 无 法 得 出 正确 的 结果 。 如 果 医 生 使 用 一 个 大 
一 点 儿 的 样本 ， 可 能 会 得 出 更 可 靠 的 结果 。 


下 面 是 医生 的 新 试验 结果 : 
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是 否 治 访 ? | 是 | 否 | 
频数 |so | | 


我 想 用 这 些 新 结果 进行 


一 次 新 的 假设 检验 . 





我 们 希望 确定 : 新 数据 是 否 会 使 检验 结果 发 生变 化 。 
让 我 们 再 进行 一 次 假设 检验 ， 这 一 次 用 一 个 更 大 的 样本 


RK 
下 荔 小 及 


新 问题 的 原 假设 是 什么 ? 备 择 假设 是 什么 ? 





研究 证 据 


假设 闪 验 磁 贴 


现在 该 进行 另 一 个 假设 检验 了 ， 这 需要 执行 一 系列 步骤 。 你 还 记 
得 这 些 步骤 的 顺序 吗 ? 请 将 磁 贴 按 正确 顺序 放 好 。 





作出 决策 


选择 检验 统计 量 
确定 要 进行 检验 的 假设 


确定 用 于 做 决策 的 拒绝 域 
求 出 检验 统计 量 的 P 什 


于 痢 检验 摘 计 重 是 盏 位于 朴 纶 六 
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假设 磁 贴 解答 


候 设 阅 贴 解答 


现在 该 进行 另 一 个 假设 检验 了 ， 这 需要 执行 一 系列 步骤 。 你 还 记 
得 这 些 步骤 的 顺序 吗 ? 请 将 磁 贴 按 正确 顺序 放 好 。 





确定 要 进行 检验 的 假设 
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研究 证 据 


让 我 们 ) 再 霸 行 a 次 假 宙 检验 确定 要 进行 检验 的 假设 


医生 对 于 制药 公司 的 断言 仍 有 疑虑 
让 我 们 根据 新 数据 进行 一 次 假设 检验 


第 1 步 : 确定 假设 


我 们 首先 需要 确定 解 克 的 原 假设 和 备 择 假设 。 提 醒 一 下 : 原 假设 即 我 们 
正在 进行 检验 的 断言 ， 备 择 假 设 则 是 在 没有 充分 证 据 拒 绝 原 假设 的 情况 下 
接受 的 假设 


那么 原 假设 是 什么 ” 备 拌 假设 又 是 什么 ? 


还 是 去 问题 


在 上 一 次 检验 中 ,我 们 采用 制药 公司 的 断言 ， 以 此 为 基础 形成 原 假 设 
我 们 现在 要 对 同样 的 断言 进行 检验 ， 因 此 原 假设 还 是 老 样 子 , 已 知 : 


备 择 假设 也 是 老 样 子 。 如 果 有 有 力 的 证 据 否定 制药 公司 的 断言 ， 则 我 
们 将 接受 “药物 的 患者 治愈 率 低 于 90%” 这 一 说 法 ， 于 是 备 择 假设 为 : 


Hi :P < 0.9 











这 么 说 你 还 未 相信 
我 ? 起 再 打击 我 一 下 ? 
放 马 过 来 吧 ! 
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选取 检验 统计 量 


第 Z 步 : 选择 检验 统计 量 


如 上 所 述 ， 第 2 步 是 选择 检验 统计 量 ， 即 需要 找 出 某 个 统计 量 ， 以 便 对 
假设 进行 检验 。 





选择 检验 统计 量 







在 前 一 个 假设 检验 中 ,我 们 通过 观察 样本 的 成 功 数目 以 及 结果 的 显著 
性 进行 检验 。 我 们 用 二 项 分 布 求 出 了 一 个 至 少 以 样本 数值 为 极 值 的 概 
率 。 换 句 话说 ， 我 们 用 检验 统计 量 X ~ B(15, 0.9) 检 验 P(X<11) 是 否 小 于 
显著 性 水 平 0.05。 





绚 域 内 
作出 决策 





这 一 次 ， 样 本 中 的 患者 数 是 100， 要 检验 的 断言 还 是 老 样 子 一 治愈 某 
位 患者 的 概率 为 0.9， 即 我 们 的 新 检验 统计 量 为 X ~ B(100, 0.9)。 











你 在 要 我 吗 ? 要 是 用 二 项 
分 布 计算 概率 鬼话 ， 我 们 
就 得 永远 角 在 这 几 算 下 去 . 


我 们 可 以 用 另 一 种 分 布 代替 二 项 分 布 。 

用 二 项 分 布 解决 这 一 类 问题 需要 计算 大 量 概率 ， 因 此 很 费时 间 。 
幸运 的 是 ， 还 有 另 一 种 方法 。 我 们 可 以 不 用 二 项 分 布 ， 而 改 用 其 他 
分 布 。 





7 动 动 肪 


你 能 用 哪 种 概率 分 布 近似 X ~ B(100, 0.9)? 
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确定 用 于 做 决策 的 拒绝 域 





求 出 检验 统计 年 的 p 值 
音 敌 样本 结 划 是 否 位 于 拒 






研究 证 据 


为 了 能 够 最 大 限度 地 发 挥 假 设 检验 的 作用 ， 你 需要 了 解 各 种 变量 和 参数 的 分 布 情况 。 在 下 
绒 习 列 情况 下 ， 你 会 用 哪 种 分 布 求 概率 ? 
人 提示， 蒜 书 前 文 已 经 对 这 些 情况 进行 设 
讲解 。 若 有 疑难 ， 请 参看 前 广 ， 


1. X ~ B(n, p)。 如 果 n 很 大 ，np > 5 且 nq > 5， 你 会 用 哪 种 概率 分 布 进行 近似 ? 


2.X ~ N(p ,0o?)。 已 知 b 和 o ?的 数值 ，X 符 合 哪 种 分 布 ? 


3.X~ N(k, 97?)。 已 知 n ， 但 不 知道 o ?的 大 小 ， 样 本 很 大 。 假 如 数据 已 知 ， 那 么 X 符 合 什么 分 布 ? 


4.X ~ N(h ,go?)。 已 知 n ， 但 不 知道 o ?的 大 小 ， 样 本 很 小 。 假 如 数据 已 知 ， 那 么 X 符 合 什么 分 布 ? 
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问题 解答 


为 了 能 够 最 大 限度 地 发 挥 假 设 检验 的 作用 ， 你 需要 了 解 各 种 变量 和 参数 的 分 布 情况 。 在 下 
绒 习 列 情况 下 ， 你 会 用 哪 种 分 布 求 概 率 ? 
解答 


1.X~ Btn, p)。 如 果 n 很 大 ，np > 5 且 ngq > 5， 你 会 用 哪 种 概 宰 分 布 进 行 近似 ? 


加 林 w 根 大 ， 则 我 们 可 以 用 正 态 分 布 近 似 X 一 色 (w, 了 P)。 由 于 ECO = 中 ，var(X) = wpa， 于 是 可 以 用 X 一 
N(wp, np) ， 其 中 急 定 np > 5, na > 5。 


2.X ~ N(h ,62)。 已 知 4 和 wo ?的 数值 ，X 符 合 哪 种 分 布 ? 
风 果 旋 们 知道 0 7 讽 数 征 ， 则 X 一 N{ ,on)。 


3.X ~ N(p ,9o?)。 已 知 。， 但 不 知道 o ?的 大 小 ， 样 本 很 大 。 假 如 数据 已 知 ， 那 么 X 符 合 什 么 分 布 ? 
如 果 我 们 不 知道 吕 ? 提 数值， 则 用 s: 讲 行 估 计 ，X 一 NCn， s/n). 


4.X~ NGu，e3。 已 知 h ， 但 不 知道 c ?的 大 小 ， 样 本 很 小 。 假 如 数据 已 知 ， 那 么 X 符 合 什么 分 布 ? 


如 果 我 们 未 知道 o :网 数 值 ， 刚 用 s: 进 行 估 计 ， 风 果 撞 本 禄 4， 刚 使 用 t 今 策 T 一 t(w- 1)， 其 中 


于 = 之 ~ 上 





站 
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在 我 们 的 检验 统计 中 有 周正 态 分 布 近 似 二 项 分 布 

我 们 照样 需要 找到 一 个 能 用 于 进行 假设 检验 的 检验 统计 量 。 由 于 样本 数 

量 很 大 ， 使 用 二 项 分 布 将 会 费时 费力 

样本 中 有 100 名 患者 ， 而 按照 制药 公司 的 说 法 ， 成 功 比例 为 0.9。 这 就 是 

说 ， 成 功 数目 服从 二 项 分 布 ， 其 中 n = 100，P = 0.9 

由 于 n 很 大 ， 且 np 和 nq 都 大 于 5， 我 们 就 用 X~N(np, npq) 作 为 检验 统计 量 ， 

其 中 X 为 成 功 治愈 的 患者 的 数目 。 即 我 们 能 够 用 
由 于 mw 很 类， 县 > 5 以 及 wa 

X ~ N(90, 9) 攻 ”很 大 ， 因 此 我 们 可 以 用 这 个 

分 布 . 

近似 我 们 所 需要 的 任何 概率 。 


经 过 标准 化 ， 得 到 : 


对 X 一 N(90. 四) 进行 








Xx - 90 一 一 
Z = be 9 
VT 标准 化 ， 
_X -90 
3 


X-90 
Z = Z~N(0,1) 


3 
X 是 治 僵 患 者 的 数目 起 


们 揭 实 例 这 
哆 实例 中 ， 这 个 数目 是 80. 










明 负 了， 检验 统计 量 
就 是 用 于 进行 检验 的 
变量 . 


你 用 检验 统计 量 计算 概率 一 该 概率 可 以 当 作 证 据 。 

这 就 是 说 ， 我 们 将 Z 作 为 检验 统计 量 一 因为 通过 它 可 以 轻松 查 出 
概率 ， 进 而 了 解 在 以 制药 公司 断言 为 前 提 的 情况 下 ， 我们 的 样本 结 
果 的 不 可 能 程度 如 何 。 我 们 将 80 代 入 X， 这样 就 能 求 出 治愈 人 数 为 
80 或 80 以 下 的 概率 。 
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研究 证 据 


547 


求解 另 一 个 拒绝 域 


第 3 步 : 求 出 拒绝 域 


有 了 检验 统计 量 之 后 ， 还 需要 求 拒绝 域 。 由 于 我 们 的 备 择 假 设 
为 p < 0.9， 这 表明 拒绝 域 位 于 左 尾 ， 这 和 前面 是 一 样 的 。 拒 绝 


踊 示 用 于 令 决 策 的 匠 绝 城 


和 
域 还 取决 于 检验 的 显著 性 水 平 ， 让 我 们 选择 和 前 面 一 样 的 显著 RT 
性 水 平 ， 即 以 5% 水 平 进行 检验 。 Fi 





作出 决策 






Zz ~ N(0, 1) 


由 于 我 们 的 检验 统计 量 符合 标准 正 态 分 布 ， 于 是 可 以 用 概率 表 
查 出 临界 值 c<。 临 界 值 即 具有 足够 证 据 拒 绝 床 假设 和 不 具有 足够 
证 据 拒绝 原 假 设 这 两 种 情况 的 分 界 值 。 


由 于 我 们 的 显著 性 水 平 为 5%， 于 是 临界 值 c 等 于 令 P{Z < c)=0.05 
的 数值 。 在 概率 表 中 查找 0.05， 得 到 c 的 数值 为 -1.64， 即 ; 


P(Z < -1.64) = 0.05 


这 说 明 只 要 检验 统计 量 小 于 -1.64， 我 们 就 有 是 够 的 证 据 拒 绝 原 
假设 。 







峰 丸 失 验 统计 量 位 于 这 个 
区 域 ， 则 有 是 各 网 证 据 拒 


稳 原 假设 . 
本 


Z ~ N(0, 1) 


-1.64 
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你 觉得 自己 能 完成 其 余 假 设 检 验 步 骤 吗 ? 看 看 能 否 求 出 下 列 结果 : 


练习 


第 4 步 : 求 p 值 
拒绝 域 位 于 分 布 的 左 尾 ， 治 意 人 数 为 80 人 ,，Z = (X - 90)Y3， 利 用 这 些 条 件 求 出 P 值 。 


第 5 步 ; 查看 检验 统计 量 是 否 位 于 拒绝 域内 
别 忘 了 : 假设 检验 的 显著 性 水 平 为 5% 。 


第 6 步 : 作出 决策 
根据 证 据 ， 你 接受 还 是 拒绝 原 假 设 ? 
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练习 解答 


A 你 觉得 自己 能 完成 其 余 假设 检验 步 又 吗 ? 看 看 能 否 求 出 下 列 结果 : 


甸 习 
解答 


第 4 步 : 求 p 值 
拒绝 域 位 于 分 布 的 左 属 ， 治 意 人 数 为 80 人 ,，Z = (X - 90)/3， 利 用 这 些 条 件 求 出 P 值 。 
让 我 们 先 囊 80 鹃 标准 今 ， 
z= (80 - 90)/3 
= -10/3 
一 -3.33 


P 值 算法 为 P( 志 <z) = P(Z < -3.33)， 查 找 概率 表 ， 得 ， 
P 值 = 0.0004 


第 5 步 : 查看 检验 统计 量 是 否 位 于 拒绝 域内 
别 记 了 : 假设 检验 的 显著 性 水 平 为 5%。 


澡 困 P 值 小 于 0.05， 则 检验 访 计 量 位 于 抠 结 域 中 。 由 于 P 值 等 于 0.0004， 说 明 检 验 统 计量 位 于 拒 
弛 域 中 . 


第 6 步 ; 作出 决策 
根据 证 据 ， 你 接受 还 是 拒绝 原 假 设 ? 


由 于 检验 统计 重 位 于 马 设 检验 鬼 抠 弛 域 中 ， 说 明 在 5 名 里 著 性 水 平 网 情况 下 ， 我 们 有 有 足够 明证 据 
拒绝 原 租 设 。 
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研究 证 据 


在 对 币 克 进行 的 这 一 次 检验 中 ， 有 足够 的 证 据 证 明 可 以 拒绝 
原 假设 ， 这 说 明 我 们 可 以 否定 制药 公司 的 断言 









我 们 一 开始 就 听 医 生 
的 不 就 闻 了 3? 







假设 检验 需要 证 据 。 

进行 假设 检验 时 ， 你 选取 一 个 断言 ， 然 后 对 其 进行 试验 。 只 有 在 有 
足够 证 据 反 双 这 个 断言 时 ， 你 才能 和 否定 这 个 断言 。 这 意味 着 检验 是 
公正 的 ， 因 为 你 做 决策 的 唯一 依据 就 是 是 否 有 充分 证 据 

如 果 我 们 一 开始 就 接受 医生 的 观点 ， 就 不 会 妥当 地 考虑 证 据 。 我 们 
会 在 不 考虑 结果 是 否 只 能 解释 为 偶然 的 情况 下 作出 决策 ， 而 现在 呢 ， 
我 们 有 足够 的 证 据 表 明 ， 样 本 结果 足以 合理 地 拒绝 原 假设 。 这 些 结 
果 具 有 统计 显著 性 ， 因 为 它们 不 可 能 是 偶然 发 生 的 。 


这 能 保证 制药 公司 的 断言 是 错误 的 吗 ? 
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我 们 的 俊 设 仿 有 斌 能 是 错误 的 


可 能 出 现 错误 


前 面 讲 到 在 假设 检验 中 如 何 将 样本 结果 作为 证 据 ， 如 果 证 据 足够 有 力 ， 
则 我 们 用 这 些 证 据 合 理 地 否定 原 假设 。 


我 们 已 经 发 现 有 足够 证 据 证 明 制 药 公司 的 断言 是 错误 的 ， 但 是 ， 能 对 此 
做 出 保证 吗 ? 












省 冀 了 ， 我 们 已 经 进行 
过 假设 检验 ， 并且 通过 检 
验证 明 制 若 公 司 在 概 访 ， 


即使 证 据 很 有 力 ， 我 们 也 无 法 绝对 保证 制药 公司 的 断 富 是 错 讽 的 。 
说 是 说 不 可 能 ， 但 我 们 仍然 可 能 做 出 错误 决策 。 我 们 可 以 通过 假设 来 检验 
证 据 ， 可 以 规定 在 确定 性 达到 何 种 程度 时 就 拒绝 原 假设 ， 但 这 些 并 不 能 完 
全 保证 我 们 的 决策 是 正确 的 。 


问题 是 ， 我 们 如 何 确定 决策 是 否 正 确 ? 


进行 假设 检验 有 点 儿 像 让 因 犯 接受 法 官 审查 ， 除 非 有 充足 的 不 利 证 据 ， 否 
则 法 官 假 定 囚 犯 无 罪 , 但 是 ， 即 使 考 虚 了 证 据 ， 法 官 仍 然 有 可 能 误 判 。 通 
过 下 一 页 的 练习 ， 你 将 明白 误 判 如 何 发 生 。 





世上 没有 便 问 题 


阅 :在 进行 假设 检验 的 时 候 ， 我 们 怎么 会 做 出 错误 决 ”网 :我 曾经 听 人 说 起 过 “显著 性 检验 ” ， 这 是 什么 ? 
策 呢 ? 我 们 做 假设 检验 不 就 是 为 了 确保 不 判 错 吗 ? 

繁 :有 些 人 把 假设 检验 称 为 显著 性 检验 ， 这 是 因为 
签 :在 进行 假设 检验 的 时 候 ， 你 只 能 根据 手头 拥有 ”你 是 按照 某 种 显著 性 水 平 进行 检验 的 。 
的 证 据 作 决策 ,证 据 来 源 于 样本 ， 因 此 ， 如 果 样 本 有 
偏 ， 那 么 你 就 会 根据 有 偏 数 据 做 出 错误 决策 。 
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研究 证 据 


一 个 囚犯 正在 因 犯罪 行为 接受 审判 ， 你 是 法 官 。 法 官 的 任务 是 
假定 办 犯 无 罪 ， 但 是 ， 假 如 有 足够 证 据 证 明 办 犯 有 和 罪 ， 则 需 宣 
判 囚犯 有罪 。 

4. 这 个 试验 的 原 假 设 是 什么 ? 


2. 备 择 假设 是 什么 ? 


3. 在 什么 情况 下 ， 法 官 做 出 正确 判决 ? 


4. 在 什么 情况 下 ， 法 官 会 做 出 错误 判决 ? 
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~、 一 个 因 犯 正在 因 犯罪 行为 接受 审判 ， 你 是 法 官 。 法 官 的 任务 是 


解 党 假定 囚犯 无 罪 ， 但 是 ， 假 如 有 足够 证 据 证 明 囚 犯 有罪 ， 则 需 宣 
判 办 犯 有 罪 。 






1. 这 个 试验 的 原 假设 是 什么 ? 
原 眼 设 是 ， 因 筷 无 其 ， 除 非 有 反面 证 据 ， 避 则 我 们 必须 风 北 级 完 . 








2. 备 择 假设 是 什么 ? 


备 振 假 设 和 是 :内 和 有 四。 也 就 是 说 ， 如 累 有 多 分 证 据 证 明 因 和 并 浊 无 菲 ， 岂 我 们 接受 因 犯 有 耿 
这 一 说 法 ,并 进行 宣判 . 







3. 在 什么 情况 下 ， 法 官 做 出 正确 判决 ? 
网 下 行事 可 进行 正确 判决 : 
因 和 无 容 ， 且 我 们 发 瑰 他 无 固 . 
因 筷 有 居 ， 且 我 们 发 观 他 有 困 . 









4. 在 什么 情况 下 ， 法 官 会 做 出 错误 判决 ? 
如 下 行事 可 做 出 钳 误 判决 
因 犯 元 罪 ， 而 我 们 发 现 他 有 居 
内科 有 有 了 申 ， 而 我 们 发 现 他 无 四 . 
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研究 证 据 






审 和 人 和 何 设 检验 策 
什么 关系 ? 


进行 假设 检验 时 可 能 会 出 现 的 锁 刘 与 审判 罪犯 时 可 能 会 犯 的 错误 是 
同样 类 型 的 错误 。 

假设 检验 的 基本 方法 是 这 样 的 : 选取 一 个 断言 ， 对 其 进行 检验 一 评估 
对 其 不 利 的 证 据 。 如 果 有 足够 的 不 利 证 据 ， 则 否定 该 断言 如 打 没 有 足 
够 的 不 利 证 据 ， 则 接受 该 断言 。 你 可 能 会 正确 地 接受 或 拒绝 原 假设 ， 但 
即使 在 考虑 了 证 据 的 情况 下 ， 仍 然 有 可 能 犯错 误 。 你 可 能 会 拒绝 一 个 正 
确 的 原 假设 ， 也 可 能 接受 一 个 实质 上 错误 的 原 假设 。 


统计 学 家 为 以 上 类 型 的 错误 给 出 了 专用 名 称 。 第 一 类 错误 : 错误 地 拒绝 
真 原 假设 ; 第 二 类 错误 : 错误 地 接受 假 原 假设 。 


假设 检验 的 功效 即 你 正确 地 拒绝 一 个 假 原 假设 的 概率 。 








这 些 都 是 省 训 这 治 出 检验 的 功放 ， 


你 认为 我 们 该 如 何 求 出 发 生 第 一 类 错误 的 概率 ”如 何 求 出 发 生 第 二 类 错误 的 概率 ? 
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第 一 类 错误 和 第 二 类 错误 


让 我 们 从 第 一 类 错误 讲 起 


第 一 类 错误 即 在 原 假设 实际 为 正确 的 情况 下 拒绝 原 假设 的 后 果 。 就 
像 审判 囚犯， 发现 其 有 罪 , 但 实际 上 他 却 无 罪 。 








和 中 实 际 上 是 正确 的 你 却 突 纪 了 ， 
这 就 发 生 了 第 一 亲 错 谋 。 -ee 


发 生 第 一 类 错误 的 概率 是 多 大 ? 


如 果 发 生 第 一 类 错误 ， 那 么 一 定 是 拒绝 了 原 假 
设 。 拒 绝 原 假 设 的 前 提 是 : 样本 结果 必须 位 于 
拒绝 域 以 内 。 


风 果 发 生 第 一 类 错误 ， 检 验 
统计 量 肯 定位 于 拒绝 域 以 内 3 


发 生 第 一 类 错误 的 概率 等 于 你 的 结果 位 于 拒绝 域 以 内 的 概率 。 由 于 拒 
绝 域 由 检验 水 平 决定 ,说 明 如 果 检 验 的 显著 性 水 平 为 a ， 则 发 生 第 一 
类 错误 的 概率 必须 也 等 于 a 。 


即 : 


P( 第 一 类 错误 ) = a 


其 中 a 为 检验 的 显著 性 水 平 。 
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再 谈 第 二 类 错误 


当 原 假设 实际 为 错误 假设 时 、 如 果 你 接受 原 假设 ， 则 发 生 第 二 类 错误 。 
这 就 像 对 一 个 囚犯 进行 审判 ， 发 现 其 无 罪 , 但 实际 上 他 是 有 罪 的 。 







册 中 为 钙 谍 假设 而 体 接 朗读 假 从 
时 册 农 生 第 二 类 错 谋 ， 


发 生 第 二 类 错误 的 概率 通常 用 希腊 字母 B 表示。 
P( 第 二 类 错误 ) = B 


如 何 求 B? 


求 第 二 类 错误 的 概率 要 比 求 第 一 类 错误 的 概率 难得 多 。 下 面 是 相关 
步 又， 我 们 将 在 下 一 页 讲解 执行 过 程 。 


@@ 检查 是 否 拥有 Hi; 的 特定 数值 。 
没有 这 个 数值 则 无 法 计算 第 二 类 错误 概率 。 
个 求 检验 拒绝 域 以 外 的 数值 范围。 
如 果 检 验 统计 量 已 经 标准 化 ， 则 该 数值 范围 要 进行 着 标准 化 。 
@ 人 贝 定 H 为 真 ， 求 得 到 这 些 数值 的 概率 。 
也 就 是 说 ， 我 们 要 求 出 得 到 拒绝 域 以 外 的 数值 的 概率 ， 但 这 一 次 用 Hi 而 不 是 Ho 对 检 
验 统计 量 进行 描述 。. 
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计算 第 一 类 错误 和 第 二 类 错误 


发 现 新 克 检 验 的 错误 


让 我 们 看 看 是 否 能 求 出 身 克 假设 检验 发 生 第 一 类 错误 和 第 二 类 错误 的 概率 。 










其 中 X 为 样本 中 的 治愈 患者 数 。 检 验 的 显著 性 水 平 为 5%。 


让 我 们 从 第 一 类 错误 算 起 
第 一 类 错误 即 在 原 假设 实际 上 为 真 时 却 拒绝 原 假设 所 引起 的 错误 ， 发 生 这 


种 错误 的 概率 与 假设 检验 的 显著 性 水 平 相等 ， 即 : 和 
这 就 是 在 “ 治 钝 率 为 ?0%” 这 个 原 假设 为 


P( 第 一 类 错误 ) = 0.05 丸 ”外 时 却 拒绝 原 假设 的 概率 . 


第 二 类 错误 如 何 计算 ? 


第 一 类 错误 即 在 备 择 假设 为 真 时 却 接受 原 假设 所 引起 的 错误 ， 只 有 在 Hi; 规 
定 了 唯一 特定 值 时 我 们 才能 计算 这 个 错误 ， 因 此 让 我 们 使 用 备 择 假设 P= 0.8， 
因为 这 个 值 是 医生 样本 的 成 功 比 例 。 于 是 我 们 的 假设 为 : 


: 只 有 在 备 择 假 
Ho: P = 0.9 这 一 次 ， 我 们 用 的 是 Hi:? = 0.8 而 不 是 Hti:P < 0.8， 有 


上 p08 全 设 和 有 只 一 竺 突 值 时 广角 计算 第 二 类 钳 误 的 发 生 术 时 


Hi 必须 规定 一 个 确切 的 P 值 ， 因 为 只 有 这 样 我 们 才能 利用 它 计算 概率 。 如 果 为 了 能 用 备 择 假设 概率 分 


我 们 使 用 备 择 假设 P < 0.9， 那 么 无 法 利用 它 计算 发 生 第 二 类 错误 的 概率 。 布 查 找 概 率 ， 我 们 需要 一 
个 确切 的 P 值 。 


如 果 在 考试 中 需要 计算 发 生 第 二 类 错误 的 概 
率 ， 题 目 会 告诉 你 Hi, 是 多 少 。 
这 就 是 说 不 需要 你 自己 确定 备 择 假设 。 如 果 需 要 计 : 
算 这 一 类 错误 ， 这 将 是 已 知 条 件 。. : 
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我 们 需要 求 数值 范围 


既然 备 择 假设 H, 有 了 一 个 特定 的 P 值 ， 我 们 就 能 进入 下 一 步 了 。 我 们 需要 求 
出 位 于 假设 检验 拒绝 域 以 外 的 X 值 。 


回头 查阅 548 页 ， 我 们 会 看 到 检验 的 拒绝 域 由 Z< -1.64 给 出 ， 即 ，P(Z < -1.64) 
= 0.05。 这 说 明 拒 绝 域 以 外 的 数值 由 Z > -1.64 给 出 。 









Zz ~ N(0, 1) 
这 此 数值 位 于 拒绝 
域 收 外 ， 


这 些 数 什 位 于 
ei : 


经 过 递 标准 化 ， 得 到 : 





X-902-1.64 x 3 
XZ-4.92 + 90 
X=85.08 
即 ， 如 果 艇 克 的 治愈 人 数 为 85.08 或 更 多 、 则 我 们 就 会 接受 原 假设 。 
最 后 ， 我 们 需要 假定 H, 为 真 、 算 出 P(X > 85.08) ， 这 样 我 们 就 能 算出 在 H 
实际 上 为 真 的 情况 下 接受 原 假设 的 概率 。 由 于 我 们 使 用 正 态 分 布 近似 X， 


于 是 需要 使 用 的 概率 分 布 为 X ~ N(np, npq)， 其 中 n = 100, P = 0.8， 得 
到 X ~ N(80, 16)。 


X ~ N(80, 16) 


这 说 明 ， 如 果 我 们 算出 P(X > 85.08)， 其 中 X ~ N(80, 16)， 我 们 就 能 求 出 
发 生 第 二 类 错误 的 概率 。 


该 概率 的 计算 方法 与 其 他 正 态 分 布 概率 的 算法 相同 ; 求 出 标准 分 ， 然 后 
在 标准 正 态 分 布 表 中 查找 数值 。 
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进一步 了 解 第 二 类 错误 


求 凡 (第 二 类 错误 ) 


通过 计算 P(X > 85.08)， 其 中 X ~ N{80, 16) ， 我 们 可 以 求 出 发 生 第 二 类 错 
误 的 概率 。 让 我 们 先 求 85.08 的 标准 分 。 这 是 洗 用 的 计算 标准 分 的 方法 
，_35.08 - 80 IC 减 去 期 独 ， 就 后 除 咏 标准 郑 。 


V16 


= 1.27 


即 ， 为 了 求 P(X > 85.08)， 我 们 需要 使 用 标准 概率 表 求 出 P(Z > 1.27)。 


P(Zz1.27) =1-P(Z < 1.27) 
=1 -0.8980 
= 0.102 


即 : 
P( 第 二 类 错误 ) = 0.102 


这 就 是 在 实际 上 忽 治 钝 80% 患 者 鬼 情 
况 下 ,接受 “人 能 治 念 90% 冲 者 ”这 个 
原 假设 的 模 些 。 


世上 没有 俐 问题 


阅 : 求 p( 第 二 类 错误 ) 为 什么 比 求 P( 第 一 类 错误 难 这 
么 多 ? 


徐 : 这 是 由 其 定义 决定 的 。 第 一 类 错误 是 错误 拒绝 
原 假设 所 引起 的 结果 ; 发 生 这 类 错误 的 概率 等 于 a_- 检 
验 的 显著 性 水 平 。 


第 二 类 错误 是 在 备 择 假设 实际 上 为 真 的 情况 下 接受 原 
假设 所 引起 的 丫 果 ， 为 了 求 出 发 生 这 一 类 错误 的 氢 率 ， 
你 首先 需要 求 出 样本 中 的 表明 你 接受 原 假设 的 数值 范 
国 。 在 求 出 这 些 数值 之 后 ， 还 需要 计算 在 假设 Hi 为 真 
的 情况 下 取得 这 些 数 值 的 概率 。 
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问 : 每 当 我 想 求 发 生 第 二 类 错误 的 概率 时 ， 都 要 用 正 
态 分 布 吗 ? 


签 : 所 用 概率 分 布 取决 于 检验 统计 重 。 在 我 们 的 
例子 中 ， 检 蛤 统计 重 符 合 正 态 分 布 ， 因 此 用 正 态 分 布 
求 P( 第 二 类 钳 误 })。 如 果 近 验 统 计量 符合 其 他 分 布 ， 例 
如 光 松 分 布 ， 则 应 该 用 泊 松 分布 。 


认识 功效 
前 面 讲 到 进行 假设 检验 时 所 发 生 的 各 种 错误 的 概率 ， 还 有 一 事 尚未 谈 
及 : 功效 。 


假设 检验 的 功效 也 是 一 种 概 滨 一 在 H, 为 假 的 情况 下 拒绝 Ho 的 概率 。 
也 就 是 说 ， 这 是 我 们 做 出 正确 决策 而 拒绝 Ho 的 慨 率 。 











依 起 来 插 氧 素 ， 希 蔓 示 要 
像 昼 P( 第 二 类 错误 ) 那 拌 
复杂 . 


只 要 求 出 P( 第 二 类 错误 ) ， 再 计算 假设 检验 的 功效 就 容易 了 。 
在 Ho 为 假 时 拒绝 He 其 实 就 是 发 牛 第 二 类 错误 的 相反 情况 。 即 : 


功效 =1-B 


其 中 等 于 发 牛 第 二 类 错误 的 概率 。 





新 克 假 设 检验 的 功效 是 多 少 ? 


我 们 已 经 求 得 第 二 类 错误 的 概率 为 0.102， 通 过 下 式 可 算得 性 克 假设 检 
验 的 功效 : 


功效 = 1 - P{ 第 二 类 错误 ) 
=1-0.102 


= 0.898 


妈 ， 身 克 假 设 检 验 的 功效 为 0.898 ， 因 此 我 们 做 出 正确 决策 而 拭 绝 原 假 
设 的 概率 为 0.898。 
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千克 是 伪劣 品 ! 


医生 开心 了 


你 在 本 章 进行 了 两 次 假设 检验 ,证 实 有 充分 证 据 和 否定 制药 厂 的 
断言 。 你 能 够 前 明 ， 根 据 医 生 的 样本 ， 有 足够 的 证 据 证 明 钉 克 
无 法 治愈 90% 的 鼻 身 患者 ， 而 制药 厂 却 断言 可 以 做 到 















我 觉得 这 个 结论 太 韶 将， 反而 未 像 
是 真 的 . 你 拿 出 了 有 力 的 统计 证 据 ， 
证 实 我 是 对 的 . 听 了 你 的 结论 ， 今 晚 
我 能 睡 个 闻 觉 了 ， 


不 过 事情 还 没有 到 此 结束 


请 接着 看 下 去 ,我 们 将 介绍 其 他 可 供 使 
用 的 假设 检验 。 肥 蛋 赌场 见 …… 
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加 制药 公司 和 他 们 的 止咳 糖浆 制造 厂 发 生 了 争议 ， 厂 方 说 注入 药 瓶 的 糖浆 量 符合 正太 分 布 
链 习 X ~ N(355, 25)， 其 中 X 是 重 得 的 每 瓶 糖浆 容量 ， 单 位 mL 。 制 药 公司 用 大 样本 进行 了 检验 ， 
(&) 发 现 100 瓶 粮 交 的 平均 容量 为 356.5mL 。 请 以 1% 的 显著 性 水 平 检验 厂 方 给 出 的 均值 假设 ， 

与 此 相对 的 另 一 说 法 是 每 瓶 糖浆 的 容量 均值 大 于 355mL 。 


第 1 步 : 确定 要 进行 检验 的 假设 。 原 假设 是 什么 ? 备 择 假 设 是 什么 ? 


第 2 步 : 选择 检验 统计 是。 。。 窗 示 ， 体 的 假设 秒 及 到 起 全 ， 周 入 


符合 什么 分 市? 如 条 进行 标准 化 ? 


第 3 步 : 决定 用 于 做 决策 的 拒绝 域 。 拒 绝 域 位 于 分 布 的 左 昆 还 是 右 尾 ? 显著 性 水 平 是 多 少 ? 
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假设 检验 的 运用 


制药 公司 和 他 们 的 止咳 糖浆 制造 厂 发 生 了 争议 ， 厂 方 说 注入 药 瓶 的 糖浆 量 符合 正 态 分 布 


练习 X ~ N(355, 25)， 其 中 X 是 路 得 的 每 瓶 糖浆 容量 ， 单 位 mL 。 制 药 公司 用 大 样本 进行 了 检验 ， 
解答 发 现 100 瓶 糖浆 的 平均 容量 为 356.5mL 。 请 以 1% 的 显著 性 水 平 检验 广 方 给 出 的 均值 假设 ， 
(上 ) 与 此 相对 的 另 一 说 法 是 每 瓶 糖浆 的 容量 均值 大 于 355mL。 


第 1 步 : 确定 要 进行 检验 的 假设 。 原 假设 是 什么 ? 备 择 假设 是 什么 ? 
我 们 想 检验 每 找 精 禁 的 容量 场 值 是 否 由 厂 方 所 述 为 355mL， 办 此 : 
Ho: Hh = 355 


Hr: nH > 355 


第 2 步 : 选择 检验 统计 量 。 


又 一 NT， OG/w)， 国 此 根据 原 能 设 得 知 :， X 一 N(355, 25/100) 或 多 一 N(355, 0.25). 


对 此 进行 标准 化 ， 得 到 : 


义 - 355 
志 三 





0.25 





第 3 步 : 决定 用 于 做 决策 的 拒绝 域 。 拒 绝 域 位 于 分 布 的 左 尾 还 是 右 尾 ? 显著 性 水 平 是 多 少 ? 


备 反 扬 设 为 上 > 355， 即 拒绝 域 位 于 汕尾 .我们 想 以 1 仙 的 时 着 性 水 平 进行 检验 ， 因 此 拒绝 域 由 
P({ 乙 > 0 = 0.01 决 定 。 利用 概率 表 ， 得到， 6c = 2.32。 即 拒绝 域 由 乙 > 2Z.32 确 完 。 
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继续 前 面 的 练习 : 这 是 假设 检验 的 后 三 步 。 你 能 得 出 什么 结论 ? 


| 


{ 下 ) 


第 4 步 : 求 假设 检验 的 p 值 。 使 用 分 布 Z = (X - 355)/0.5， 即 样本 糖浆 的 容量 均值 ， 记 住 ， 这 一 次 你 需要 查看 
检验 统计 量 是 否 位 于 分 布 的 右 尾 ， 因 为 这 正 是 拒绝 域 所 在 位 置 。 


第 5 步 : 查看 样本 结果 是 否 位 于 拒绝 域 以 内 。 记 住 : 检验 的 显著 性 水 平 是 1%。 


第 6 步 ; 作出 决策 。 是 殖 有 足够 的 证 据 拒绝 显著 性 水 平 为 1% 的 原 假设 ? 
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练习 解答 


继续 前 面 的 练习 : 这 是 假设 检验 的 后 三 步 。 你 能 得 出 什么 结论 ? 
棋 习 
解答 
(下 /) 


第 4 步 : 求 假 设 检验 的 p 值 。 使 用 分 布 Z = (X - 355)/0.5， 即 样本 糖浆 的 容量 均值 ， 记 住 ， 这 一 次 你 需要 查看 
检验 统计 量 是 否 位 于 分 布 的 右 尾 ， 因 为 这 正 是 拒绝 域 所 在 位 置 。 
世 = (X- 355)/0.5 
= (356.5 - 355)/0.5 
= 1.5/0.5 
二 3 
中 于 拒绝 域 位 于 右 尾 ， 因 此 检验 沟 p 什 由 P( 乙 > 3) 决 定 ， 查找 率 表 ， 得 到 ， 


? 值 = 0.0013 


第 5 步 : 查看 样本 结果 是 否 位 于 拒绝 域 以 内 。 记 住 : 检验 的 显著 性 水 平 是 1%。 


T 健 0.0073 路 于 显著 性 水 平 0.01 ， 这 囊 明 拌和 地 结果 位 于 拒绝 域 必 内 ， 


第 6 步 : 作出 决策 。 是 否 有 足够 的 证 据 拒绝 显著 性 水 平 为 1% 的 原 假 设 ? 
由 于 样本 结果 位 于 抠 纺 域 以 内 ， 响 竞 分 的 证 据 拒 续 原 急 设 。 我 们 可 以 接受 备 拌 假设 ，h > 355 mt。 


@ 第 一 类 错误 即 在 原 假 设 正确 时 却 拒绝 原 假 设 。 发 生 第 一 类 错误 的 概率 
为 a -一 即 检验 的 显著 性 水 平 。 


@ 第 二 类 错误 即 在 原 假设 氏 误 时 却 接受 原 假 设 。 发 生 第 二 类 错误 的 概率 
用 BB 表示。 


@ 为 了 求 出 B ， 备 择 假设 必须 为 一 个 特定 数值 。 于 是 你 求 出 检验 拒绝 域 
以 外 的 数值 范围 ， 然 后 求 出 以 H 为 条 件 得 到 这 个 数值 范围 的 概率 。 
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14 ?分 布 有 


+ 继续 探 1 





我 以 为 他 的 恋 受 成功 
率 会 符合 p=0.8 的 二 项 
分 布 . 结果 我 错 得 高 


有 时 候 事实 与 期 望 并 不 相符 。 

当 以 一 种 特定 的 概率 分 布 为 某 种 情况 建 模 时 ， 对 于 事物 的 长 期 可 能 结果 ， 你 有 十 
分 清晰 的 想法 。 可 如 果 期 望 与 事实 存在 差别 呢 ? 你 该 如 何 判断 ? 一 这 些 偏差 是 
正常 波动 ， 还 是 说 明 概率 模型 存在 问题 ? 本 章 将 讲解 如 何 利用 X2 分 布 分 析 结果 ， 
排除 可 疑 结果 。 


进入 新 的 篇 伺 


= Pe | 
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有 人 在 操纵 肥 蛋 赌场 吗 ? 


肥 蛋 赌场 可 能 有 了 麻烦 

肥 蛋 赌场 惯 于 从 赌 客 身上 捞 钱 ， 不 过 ， 这 个 星期 它 
磁 到 了 问题 一 老虎 机 总 是 出 头 奖 ， 轮 盘 总 是 停 在 
12 位 ， 般 子 老 是 不 称 手 ， 有 一 张 财 二 十 一 点 的 牌 桌 上 
出 现 了 太 多 赢家 

赌场 再 这 么 赔 下 去 就 撑 不 住 了 ， 肥 和 蛋 老 板 怀 疑 有 人 
动 了 手脚 ， 他 需要 你 帮 他 探 明 究竟 。 
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让 我 们 从 老虎机 开始 


前 面 已 经 讲 过 ， 肥 蛋 赌场 有 一 大 排 亮 闪闪 的 老虎 机 ， 只 等 着 大 家 去 财 。 问 题 
是 ， 人 们 不 仅 赌 个 不 停 一 -而且 闸 个 不 停 。 


下 面 是 某 台 老 虎 机 的 期 望 概率 分 布 ， 其 中 X 代 表 每 一 局 游戏 的 净 收 益 ; 

， 如 果 中 了 藉 奖 ， 净 收 
委 局 ? 承 元 ， 雹 累计 么 也 一 J V4 站 就 是 98 业 元 。 
成 未 到 拘 话 ， 你 就 损 夫 
2 莹 元 





赌场 搜集 了 一 些 统计 数据 ， 给 出 了 人 们 获得 某 种 收益 的 次 数 。 下 面 是 观察 到 
”的 每 局 净 收益 的 频数 
频数 指出 参 种 收益 后 发 
生 次 数 ， DY TI I CE WS ED ER 
冰 数 |%s To |9 | 7 


观察 频数 即 实际 发 生 的 我 们 需要 将 每 个 x 值 的 实际 频数 与 根据 概 宰 分 布 得 出 的 期 望 频 数 
进行 比较 。 请 填写 下 表 ， 看 出 什么 了 吗 ? 


a ， 总 现 察 频 孝 为 1.000 , 将 见 
个 纲 察 频数 所 加 即 可 覃 到 这 个 数值 。 
布 算出 期 芝 频 教 。 
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动 动笔 解答 


~ 解 管 我 们 需要 将 每 个 x 值 的 实际 频数 与 根据 概率 分 布 得 出 的 期 望 频数 
进行 比较 。 请 填写 下 表 ， 看 出 什么 了 吗 ? 


用 每 种 千 时 的 概率 聂 m 
[ri 总 频 数 1000， 可 得 期 
频数 ， 













观察 频数 


你 根据 概率 分 布 得 出 的 期 望 赢 取 头 奖 人 数 与 实际 赢 取 头 奖 人 数 之 同 有 差别 ， 但 我 们 不 知 
道 这 些 卷 别 的 显著 程度 . 





Pi 
记 于 
23 | | 
EN “ev 
73 
Ds 


| 












观察 这 些 数据 ， 仅 乎 老虎 机 
的 赔付 额 存 在 某 种 规律 。 可 
我 们 邮 何 肯定 这 一 点 呢 ? 这 种 
事 系 太 可 能 一 可 也 有 可 能 会 
发 生 。 









我 们 需要 以 某 种 方式 判定 : 这 些 结果 能 否 说 明 老虎 机 受到 操纵 。 

我 们 需要 进行 某 种 假设 检验 ， 以 此 检验 观察 频数 和 期 望 频数 之 间 的 差别 。 
这 样 一 来 ,我 们 就 有 办 法 判定 : 老虎 机 是 否 被 人 动 过 手脚 一 - 以 致 这 些 
机 器 不 断 进行 大 额 赔付 。 


问题 是 ,我 们 能 用 哪 种 分 布 进 行 这 项 假设 检验 ? 
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继续 探讨 …… 


用’: 检验 评估 蚌 异 


有 一 种 概率 分 布 正 合 我 们 的 心意 一 X 分 布 ，X 读 作 “ 卡 ”， 是 希腊 字母 
chi 的 大 写 。 这 种 分 布 通 过 一 个 检验 统计 量 来 比较 期 望 结果 和 实际 结果 之 间 
的 差别 ， 然 后 得 出 观察 频数 极 值 的 发 生 概 率 。 


让 我 们 先 求 检验 统计 量 。 为 此 ， 首 先 面 一 张 表 ， 填 人 相应 问题 的 观察 频数 
和 期 望 频 数 ， 然 后 ， 用 观察 频数 和 期 望 频数 计算 下 列 统计 症 ， 其 中 O 代 表 
观察 频数 ，E 代 表 期 望 频数 。 


代表 观察 频数 ， 5E 代 天 期 望 频 数 。 


eo 


即 ， 对 于 概率 分 布 中 的 每 一 个 概率 ， 取 期 望 频数 和 实际 频数 的 差 ， 求 差 
的 平方 数 ， 再 除 以 期 望 频数 ， 然 后 将 所 有 结果 相 加 。 


那么 老虎 机 问题 的 检验 统计 量 是 多 少 ? 


心肠 吧 艺 






用 在 上 一 页 算出 的 肥 蛋 赌场 老虎 机 观察 频数 和 期 望 频数 表 计 算 检 
验 统 计量 。 看 结果 如 何 ? 


数值 小 说 明 什么 ? 数值 大 说 明 什么 ? 
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动 动笔 解答 


泌 动荡 
小 解答 













用 在 上 一 页 算出 的 肥 蛋 赔 场 老虎 机 观察 频数 和 期 望 频数 表 计 算 检 
验 统计 晤 。 看 结果 如 何 ? 


数值 小 说 明 什 么 ? 数值 大 说 明 什 么 3 





Xz 一 《965 — 977)z/977 + {10 - 8)*/8 + (9 - 8)*/8 + (9 -6)%/6 + (7 ~ 1)%1 
= (-12)2/977 + 22/8 + 12/8 + 3:/6+ 67 
= 144/977 + 4/8 + 1/8 + 9/6 + 36 
一 0.147 十 0.5 十 0.125 十 1.5 十 36 


一 38.272 


风 困 X? 信 很 小 ,说 映 现 察 频数 和 期 整 频 数 之 问 明天 别 示 显效 :Xi 说 大 ， 类 别 拉 显 着 


检验 统计 量 代 表 付 么 ? 


检验 统计 量 X 提供 了 一 种 对 观察 频数 和 期 望 频数 之 间 的 差异 进行 量度 的 办 
法 。X 的 数值 越 小 ， 观 察 频数 和 期 望 频数 之 间 的 总 差 值 越 小 。 


除数 E 为 期 望 频数 ， 于 是 所 得 结果 与 期 望 频数 成 反比 例 。 


吕 和 E 之 回响 盖 值 起 小 ，X 这 小 ， 
X22 (9 - EY 


心 E 纹 除数 ， 今 郑 值 与 期 锡 频 数 成 
E «< 
比例 .。 


X: 大 到 什么 程度 才 算得 上 显著 呢 ? 一 我 们 需要 指出 : 在 什么 情况 下 才能 
十 分 肯定 地 判定 老虎 机 出 了 问题 一 而 且 这 个 问题 已 经 超出 了 “合理 偶然 
性 ”的 范围 。 


为 此 我 们 需要 讲 讲 X? 分 布 。 
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继续 探讨 …… 


X! 分 布 的 两 个 主要 膨 途 

Xz 概 率 分 布 主要 用 于 检查 实际 结果 与 期 望 结果 之 间 何 时 存在 显著 差别 ， 
该 概率 分 布 使 用 前 面 讲 到 的 检验 统计 量 X? 进 行 检验 。 

X? 分 布 有 两 个 主要 用 途 。 


第 一 是 用 于 检验 拟 合 优 度 ， 也 就 是 可 以 检验 一 组 给 定 的 数据 与 指定 分 布 
的 吻合 程度 。 例 如 ， 可 以 用 它 检 验 老虎 机 收益 的 观察 频率 与 我 们 所 期 


望 的 分 布 的 吻合 程度 。 

?分布 的 另 一 个 用 途 是 检验 两 个 变量 的 独立 性 ， 通 过 这 个 方法 可 以 检查 

变量 之 间 是 否 存在 某 种 关联 。 

xX? 分 布 用 到 一 个 参数 一 希腊 字母 v， 读 作 “ 纽 ”， 让 我 们 看 看 v 如 何 影 

响 概率 分 布 的 形状 。 

当 V 等 于 1 或 和 如 果 vV 为 1 或 2， 则 X 分布 网 外 
当 v 等 于 1 或 2 时 ，X? 分 布 为 一 条 先 高 后 低 的 平滑 曲线 ， 其 形 K” 形 是 这 样 的 ， 


状 像 一 个 倒立 的 ]。 检 验 统计 量 等 于 较 小 数值 的 概率 远 远 高 于 
等 于 较 大 数值 的 概率 ， 这 就 是 说 ， 观 察 频数 有 可 能 接近 期 望 
频数 。 





当 V 大 于 2 加 果 v 大 于 2， 则 图 形 风 下 .YY 

后 天， 分布 欣 外 和 形 硫 接近 正 
当 v 大 于 2 时 ，X? 分 布 的 形状 发 生 改 变 随 着 XxX? 递增 ， 图 形 
先 低 ， 后 高 ， 再 低 ， 其 外 形 沿 着 正 向 扭曲 ,但 当 v 很 大 时 ， 图 


形 接近 正 态 分 布 。 








车 你 正在 使 用 具有 特定 参数 v 的 X? 分 布 以 及 检验 统计 量 X*， 可 简单 
记 作 : 
x 符合 X?' 分 市 给 完 值 为 v， 


又 2 A xv) 
看 上 去 像 X， 但 更 显 氢 曲 ， 
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自由 度 


Vv 表示 自贡 度 


前 面 讲 到 v 如 何 影响 X 分 布 的 形状 ， 如 何 求 出 v 呢 ? 


v 为 自由 度数 目 ， 即 用 于 计算 检验 统计 量 X 的 独立 变量 的 数目 ， 或 可 以 说 是 
独立 信息 段 的 数目 。 让 我 们 结合 实际 进行 说 明 。 


下 面 回顾 一 下 老虎 机 的 观察 频数 和 期 望 频数 : 





自由 度数 目 等 于 我 们 要 计算 的 期 望 频数 的 数目 一 计算 时 要 考虑 我 们 所 受 
到 的 各 种 限制 。 


为 了 计算 检验 统计 量 X:， 我 们 必须 计算 所 有 的 期 望 频率 ， 也 就 是 必须 计算 5 
个 期 望 频数 。 进 行 计 算 时 要 记 住 一 点 : 期 望 频数 总 和 与 观察 频数 总 和 必须 
相同 -一 这 就 是 说 ， 我 们 进行 计算 时 受到 1 个 限制 。 


名 人 么 v 是 多 上 少 ? 


为 了 算出 v， 我 们 取 所 计算 过 的 信息 的 数目 ， 减 去 所 受到 的 限制 的 数目 。 为 
了 算出 检验 统计 量 X?， 我 们 必须 计算 5 个 独立 信息 ， 同 时 受到 1 个 限制 。 于 
是 ， 自 由 度 的 计算 结果 为 : 
v=5-1 
= 44 
以 上 结果 还 可 以 这 样 理解 : 我 们 必须 利用 概率 分 布 计算 4 个 期 望 频数 ; 至 于 
最 后 一 个 频数 ， 则 可 以 先 求 出 总 期 望 频数 ， 再 求 出 最 后 一 个 频数 。 


一 般 说 来 ， 
v = (组 数 ) - (限制 数 ) 
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继续 探讨 …… 


显著 性 是 多 少 ? 


我 们 如 何 利用 分布 指 出 观察 频数 和 期 望 频数 之 间 的 差异 显著 性 ? 


和 其 他 假设 检验 一 样 ， 这 都 取决 于 显著 性 水 平 Ee 
和 计生 

用 X? 分 布 进行 的 检验 为 单 尾 检验 ， 右 尾 被 作为 拒绝 域 。 于 是 ， 通 过 成 信 于 上 尾 ， 浴池 之 的 

查看 检验 统计 量 是 否 位 于 右 尾 的 拒绝 域 以 内 ， 你 就 可 以 判定 根据 期 | 大， 观 罕 和 


望 分 布 得 出 的 结果 的 可 能 性 。 
如 果 用 显著 性 水 平 进行 检验 ， 则 可 以 写作 : 


2 
X uc(v) 
那么 如 何 求 X 分 布 的 拒绝 域 呢 ? 我 们 可 以 使 用 X 概率 表 





和 如何 使 用 X 概率 表 


为 了 求 出 临界 值 ， 首 先 应 找 出 自由 度 v 以 及 显著 性 水 平 a 。 在 第 一 列 
查找 v， 第 一 行 查找 a ， 交 点 即 x 值 ， 从 P(X a (v) = x) = a 得 出 临界 值 


例如 ， 以 5% 为 显著 性 水 平 ，8 为 自由 度 进行 检验 ， 车 要 求 临 界 值 ， 
则 在 第 一 列 查找 8， 第 一 行 查找 0.05， 查 出 数值 15.51。 因 此 ， 只 要 
检验 统计 量 X? 大 于 15.51， 则 在 显著 性 水 平 为 5%、 自 由 度 为 8 的 情况 
下 ， 检 验 统 计量 就 位 于 拒绝 域 以 内 。 


这 一 行为 


i pl 
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X2 假 设 检 验 步骤 


看 着 眼熟 吗 ? 大 部 分 步骤 都 和 其 他 假设 检验 完全 一 样 ， 也 就 是 说 ， 这 个 


过 程 与 前 面 讲 过 的 过 程 完 全 相同 。 


阅 :这 么 说 xz 检验 其 实 就 是 假设 
检验 的 特殊 形式 ? 


答 :是 的 ， 正 是 如 此 。 检 验 步 
也 完全 和 前 文 讲 过 的 步 瑟 一 样 。 


阅 :检验 时 总 是 使 用 右 尾 中? 
答 :是 的 ,假设 检验 总 是 使 用 


右 旦 。 这 是 因为 检验 统计 量 越 大 ， 
观察 频数 与 期 望 频 数 的 差别 越 大 。 
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世上 没有 人 适 问题 


隐 : 我 想 我 在 前 面 看 到 过 自由 度 
这 个 术语 ， 对 不 对 ? 


答 : 没 错 ， 前面 看 到 过 。 还 记 
得 我 们 讲 过 如 何 用 t 分 布 建立 置信 区 
间 吗 ? 对 ，t 分 布 也 用 到 了 自由 度 。 


隐 :我 想 以 前 是 把 自由 度 叫做 df 
的 ， 而 不 是 v， 我 记 错 了 吗 ? 


答 ; 一 点 几 没 有 错 。 不 同 课本 
有 不 同 的 药 定 ， 载 们 用 的 是 v。 反 
正 ， 它 们 意思 相同 。 


xX! 假设 检验 
下 面 是 用 x 分布 进 行 假设 检验 的 几 大 步 台 : 
而 定 要 进行 检验 的 假设 及 其 备 择 候 设 
人 求 出 其 如 频 政和 自由 度 
@@ 确定 用 于 做 决策 的 拒绝 红 a 
设 杏 步 药 前 面 扣 到 网 
各 前面 的 GO iHENMIiHax < 一 一 光标 不 
和 步 慰 一 神 SR 
人 埋 槛 检 驼 统计 量 是 否 位 于 拒绝 域 以 内 
@ 作出 决策 


阅 : 我 想 在 网 上 查找 x: 分布 的 信 
息 。 该 怎么 查找 呢 ? 可 输入 希腊 字 
母 吗 ? 


答 3 查找 “ 卡 方 ” 即 可 。X 也 
写作 “ 卡 方 ” 。 


继续 探讨 …… 


你 的 任务 是 ， 在 5% 的 显著 性 水 平 下 ， 看 看 是 否 有 足够 的 证 据 判定 老虎 机 被 人 动 了 手脚 。 请 
本 按 所 给 步骤 进行 计算 。 


1, 要 检验 的 原 假 设 是 什么 ? 备 择 假设 是 什么 ? 


2. 自由 度 为 4，59% 水 平 的 拒绝 域 是 多 少 ? 


3 检验 统计 重 是 到 入 提 示 ， 前 面 已 经 计算 过 . 


4. 检验 统计 量 是 在 拒绝 域 以 内 还 是 在 拒绝 域 以 外 ? 


5. 你 将 接受 还 是 拒绝 原 假 设 ? 
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练习 解答 


加 你 的 任务 是 ， 在 59 的 显著 性 水 平 下 ， 看 看 是 否 有 足够 的 证 据 判定 老虎 机 被 人 动 了 手脚 。 请 
链 三 按 所 给 步骤 进行 计算 。 
解答 
1. 要 检验 的 原 假设 是 什么 ? 备 择 假设 是 什么 ? 
Ha， 老虎 机 每 局 收 曙 符合 加 下 横 率 分 市 。 


EN ESE CE EE 


Cm 
om [om looo [oo0s oo oo | 





Ht， 老虎 机 条 局 收 基 不 符合 以 上 报 率 分 布 。 


2. 自由 度 为 4，5% 水 平 的 拒绝 域 是 多 少 ? 
从 概率 未 上 查 查 X if(4) = 9.49， 即 拒绝 域 为 Xz > 9.49 的 范围 . 


3. 检验 统计 量 是 多 少 ? 
检验 统计 量 为 X， 前 面 已 经 计算 过 ， 鸭 38.272。 


4. 检验 统计 量 是 在 拒绝 域 以 内 还 是 在 拒绝 域 以 外 ? 
Xz 网 数值 为 38.27， 且 由 于 拒绝 域 为 xz > 9.49， 因 此 Xz 倍 于 拒绝 域 以 内 。 


5. 你 将 接受 还 是 拒绝 原 假设 ? 


X 的 数 钙 位 于 拒绝 域 以 内 ， 于 是 我 们 拒 针 原 仍 设 ， 即 ， 我 们 有 充足 的 证 据 拒 弛 上 述 “老虎 搞 每 局 收益 符 
合 如 下 概率 今 布 ”这 个 原 假 投 。 
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你 解 开 了 老虎 机 之 过 


通过 小 心 运用 X 分 布 ， 你 发 现 有 充足 的 证 据 证 明 老虎 机 不 符合 赌场 期 望 它 们 
符合 的 概率 分 布 。 肥 和 蛋 十 分 感激 你 ， 是 你 的 证 据说 明 老 虎 机 被 人 动 了 手脚 。 
他 把 这 些 老虎 机 停 了 ， 免 得 赔钱 。 





让 我 们 总 结 一 下 你 的 解答 步骤 


首先 ， 你 得 到 了 老虎 机 的 一 组 观察 频数 ， 然 后 假定 这 些 频 数 符 合 某 种 特定 的 
概率 分 布 并 算出 了 期 望 频 数 。 然 后 你 算出 自由 度 和 检验 统计 量 X， 通 过 x 可 以 
看 出 观察 频数 和 期 望 频数 之 间 的 总 偏差 。 


然后 ， 你 从 x 概率 表 查 出 显著 性 为 5% 时 的 拒绝 域 ， 经 过 与 检验 统计 量 进行 比 
较 ， 你 发 现 有 足够 的 证 据 判定 : 老虎 机 被 人 动 过 手脚 ， 所 以 才 会 多 赔钱 







ff 水 的 检验 统计 量 位 于 拒绝 城 以 内， 因此 可 以 


EE 拒绝 原 假设 ， 


二 
这 种 假设 检验 称 为 拟 合 优 度 检验 一- 它 检验 观察 频数 是 否 和 假设 的 概率 分 布 
相 吻 合 。 若 你 有 一 组 数据 ， 并 希望 这 组 数据 符合 某 种 分 布 ， 为 了 看 看 这 组 数 
据 是 否 确 实 符合 这 种 分 布 ， 则 可 以 用 拟 合 优 度 检验 。 


继续 探讨 …… 
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加 强 综 习 
加强 绒 习 


肥 蛋 认为 朋 子 有 问题 。 下 表 中 列 出 了 一 个 仍 子 的 观察 频数 ， 查 看 这 些 数据 ， 并 以 1% 的 显 
著 性 水 平 进行 检验 ， 看 看 是 否 有 足够 的 证 据说 明 的 确 存在 不 公正 。 清 按照 我 们 给 出 的 步 
骤 进 行 。 

下 面 是 观察 频数 : 






数值 Il1 |2 |3 [4 [ls ls 
里 下 or | | [zs la |zs 


第 1 步 : 决定 要 进行 检验 的 假设 和 备 择 假设 。 


第 2 步 : 求 期 饭 频数 和 自由 度 。 
首先 填写 催 子 的 期 望 频数 ， 应 考虑 撞 台 子 的 总 次 数 以 及 每 个 数值 的 掷 出 概率 。X 代 表 抑 出 的 他 子 点 数 。 





求 出 期 望 频数 后 ， 再 算 算 自 由 度 是 多 少 ? 


~ 由 度 计 商 方 法 和 老虎 机 用 网 方法 相同 ， 
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继续 探讨 …… 






第 3 步 : 确定 用 于 做 决策 的 拒绝 域 。 
将 会 用 到 显著 性 水 平和 自由 度 。 


第 4 步 : 计算 检验 统计 年 Xx”。 
可 以 用 第 2 步 算出 的 观察 频数 和 期 望 频数 进行 计算 。 


第 5 步 : 看 看 检验 统计 重 是 否 位 于 拒绝 域 以 内 。 


第 6 步 : 作出 决策 。 
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加 强 练习 解答 

Ce 
肥 蛋 认为 角 子 有 问题 。 下 表 中 列 出 了 一 个 锅子 的 观察 频数 ， 查 看 这 些 数 据 ， 并 以 1% 的 显 
著 性 水 平 进行 检验 ， 看 看 是 否 有 足够 的 证 据说 明 的 确 存 在 不 公正 。 请 按照 我 们 给 出 的 步 桑 









进行 。 

下 面 是 观察 频数 : 

WW 2 J |4 |s [se | 
MW 7 ls le ls | la 


第 1 步 ; 决定 要 进行 检验 的 假设 和 备 择 假设 。 
为 了 检验 般 子 是 否 公 正 ， 我 们 必须 确定 是 否 有 足 吝 证 据说 明 般 可不 公正 。 


于 是 ， 
Ho 靓 弛 公正 ， 租 一面 数值 拘 撞 出 几率 都 相同 ， 即 恳 一 面 数值 的 发 生 摄 率 为 1/6。 


由 二 子 不 公正 。 


第 2 步 : 求 期 望 频数 和 自由 度 。 

首先 填写 般 子 的 期 望 频数 ， 应 考虑 掷 蜗 子 的 总 次 数 以 及 每 个 数值 的 掷 出 概率 。X 代 表 搓 出 的 从 子 点 数 。 
暂 总 观察 频数 
上 观察 频数 相 


一 面 庆 值 的 鬼 出 福 罕 和 2 
因 此 每 一 面 数值 的 期 时 频 旬 


1002/8 一 167 。 





求 出 期 望 频 数 后 ， 再 算 算 自 由 度 是 多 少 ? 


我 们 必须 囊 出 6 个 期 电 频 数 ， 其 总 和 等 于 1002， 即 我 们 必须 事 出 6 个 信息， 同时 受到 1 个 根 制 ， 因 此 ， 


v=6-1 
一 与 
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继续 探讨 …… 

















第 3 步 : 确定 用 于 做 决策 的 拒绝 域 。 


会 用 到 显著 性 水 平和 自由 度 
从 概率 表 查 出 X ,g(5) = 15.09， 于 是 拒 玫 域 为 X > 15.09 的 范围 ， 


第 4 步 : 计算 检验 统计 量 X*。 
可 以 用 第 2 步 算出 的 观察 频数 和 期 望 频数 进行 计算 。 


2 > 
XX 三 
E 


= (107-167)2/167 + (198-167)2/167 + (192-167)J2/167 + (125-167)2/167 + (132-167)27T67 十 【248- 
167)2/167 





= (-60)2/167 + (31)2/167 + (25)2/167 + (-42)2/167 + (-35)*/167 + (81)2/167 
= (3600 + 961 + 625 + 1764 + 1225 + 6561)/167 
= 14736/167 


三 88.24 


第 5 步 : 看 看 检验 统计 量 是 否 位 于 拒绝 域 以 内 。 
拒绝 城 由 X > 15.09 决 定 ， 由 于 多 = 38.24， 因 此 检验 统计 量 住 于 把 绝 域 内 。 


第 6 步 : 作出 决策 


由 于 你 歇 检 验 缠 计量 位 于 拒绝 域 向 ,说明 在 显著 性 水 平 为 1 名 多 情 况 下 ， 人 有 足 站 蚂 证 据 拒 绝 原 艇 设 ， 于 是 你 
接受 备 择 假 设 ， 般 区 不 公正 。 
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分 布 小 抄 

















这 人 么 说 可 以 将 X 分 布 拟 合 优 度 检 
验 用 于 各 种 基础 概率 分 布 ? 






x 拟 合 优 度 检验 对 相当 多 的 概率 分 布 都 有 效 。 


率 分 布 的 拟 合 优 度 。 


可 在 进行 x 拟 合 优 度 检验 时 使 用 . 


?是 成 功 概率 ， 或 者 说 
是 总 体 揭 成 功 概 率 . 


是 观察 频数 


总 数 ， 






已 知 p 


未 知 p， 必须 通过 观察 频数 |v = | | 
进行 估计 







进行 估计 
本 是 一 定 区 间 
内 的 发 生 率 

未 知 上 和 ca?， 必须 通过 观察 |v= Nn- 


频数 进行 估计 
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只 要 你 得 到 一 组 观察 频数 ， 且 能 算出 期 望 频数 ， 就 可 以 用 x 分 布 检验 任何 概 


最 大 的 困难 在 于 自由 度 v 的 计算 ， 下 面 是 最 常用 的 一 些 概率 分 布 的 自由 度 ， 


继续 探讨 …… 


肥 蛋 过 到 3 了 新 间 题 


前 面 你 调查 了 老虎 机 是 否 被 人 动 过 手脚 ， 用 的 是 拟 合 优 度 检验 ， 目 的 
是 判断 观察 频数 是 否 与 所 期 望 的 概率 分 布 相 吻 合 。 肥 蛋 还 有 一 个 问题 ， 
这 一 次 事 关 内 部 员工 。 


肥 蛋 觉得 有 一 位 负责 二 十 一 点 财 桌 的 庄家 赔付 的 钱 高 于 合理 值 。 你 能 
判断 一 下 是 否 有 显著 证 据 证 明 肥 和 蛋 的 怀疑 没 错 ? 


下 面 是 负责 赌 桌 的 三 位 庄家 : 





我 们 需要 找到 某 种 方法 ， 检 验 赌 局 结果 是 否 取决 于 坐庄 赌局 的 庄家 。 


动 过 了 能 


检验 以 上 假设 需要 知道 哪些 条 件 ? 
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独立 性 检验 


2 
X 分 布 可 以 检验 独立 性 
前 面 讲 到 分 布 可 用 于 进行 拟 合 优 度 检验 ,分 布 的 用 途 不 仅 如 此 ， 它 
还 能 用 于 进行 独立 性 检验 。 


独立 性 x 检验 可 用 于 判断 两 种 因素 是 否 相 互 独立 ， 或 两 者 是 否 看 上 去 互 
有 联系 。 这 正 合 我 们 对 庄家 的 检验 要 求 一 我 们 要 检验 在 二 十 一 点 赌局 
中 坐庄 的 庄家 是 否 对 赌局 输赢 有 影响 。 换 名 话说， 我 们 假定 庄家 的 选择 
与 输赢 无 关 一 除非 有 足够 的 证 据 可 以 反 驶 这 一 点 。 

独立 性 检验 的 过 程 与 拟 合 优 度 的 检验 过 程 相同 : 设立 一 个 假设 ， 用 观 
察 频 数 和 期 望 频数 计算 X? 检 验 统 计量 ， 然 后 查看 结果 是 否 落 在 拒绝 域 
以 内 。 





等 一 等 ! 我 看 你 说 漏 什 么 了 ， 我 们 怎 
么 能 算出 期 望 频数 ? 我 们 能 用 的 只 有 
从 赌局 中 观察 到 的 频数 而 已 . 






为 了 计算 检验 统计 量 Xz， 我 们 需要 知道 期 望 频数 。 
这 说 明 我 们 需要 通过 观察 频数 算出 期 望 频数 ， 这 得 依靠 概率 ……: 
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继续 探讨 …-- 


可 用 概 率 求 出 期 望 频数 
期 望 概率 可 通过 几 个 步骤 求 得 。 


首先 ， 算 出 赌局 结果 和 庄家 总 频数 以 及 各 项 的 总 和 ， 例 如 可 列 出 下 表 ， 
这 叫做 列 联 表 。 


1 大 局 次 数 
4 kK 


笨 家 A 合计 





现在 我 们 可 以 用 以 上 信息 求 出 每 一 位 庄家 的 启 局 期 望 频数 。 
让 我 们 先 求 出 庄家 A 的 赢 局 期 望 频数 。 


首先 ， 我 们 可 以 用 以 上 总 和 求 出 得 到 一 个 特定 结果 的 概率 ， 或 者 求 出 某 位 庄家 的 概率 。 
例如 .为 了 求 出 赢 局 概率 ， 可 以 用 车 局 合计 内 以 总 和 : 


翰 局 合计 

P(W) = 一 一 一 

同样 ， 可 用 庄家 A 的 坐庄 次 数 除 以 总 和 ， 求 出 庄家 A 的 坐庄 概率 : 
合计 A 





P(A) = 


现在 ， 按 照 我 们 的 假设 ， 如 果 庄 家 和 赌局 结果 相互 独立 ， 那 么 ， 
通过 将 两 种 概率 相 习 ,可 以 求 出 庄家 A 坐庄 时 出 现 赢 局 的 概率 ， 


和 第 4 章 讲 过， 对 于 独立 事件 : 


pA Me) = POA} x P{®e)，, 
汪 且 合计 ASG 计 攻 
— x 


总 和 总 和 


0 动 荔 入 


我 们 如 何 利用 以 上 公式 求 出 庄家 人 A 的 赢 局 期 望 频 数 ? 





P(A 庄 赢 局 ) = 
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求解 频数 


频数 是 多 少 ? 


前 面 求 出 了 庄家 A 的 赢 局 概率 ， 我 们 希望 通过 这 个 结果 求 出 赢 局 的 期 望 
频数 。 为 此 只 要 将 庄家 A 的 琶 局 概率 乘 以 总 和 即 可 。 于 是 ， 


赢 局 合计 。 A 总 计 
望 频 数 = ) 一 一 > 一 一 
期 望 频数 = 其 和 x a 
_ 赢 局 合计 x A 总 计 
总 和 


即 ， 为 了 求 出 庄家 A 的 赢 局 期 望 频数 ， 可 用 所 有 启 局 合计 数目 乘 以 庄家 
A 的 赌局 数目 ， 然 后 除 以 总 和 。 


一 般 我 们 姻 何 求 频数 ? 


将 以 上 结果 推 而 广 之 ， 可 以 得 到 一 个 求 频数 的 通用 公式 : 为 了 求 出 特 
定 行 和 特定 列 形 成 的 组 合 的 期 望 频数 ， 可 用 每 行 合计 乘 以 每 列 合计 ， 
然后 除 以 总 和 。 


_ 行 合计 x 列 合计 
总 和 


求 出 所 有 期 望 频数 后 ， 即 可 用 它 计 算出 检验 统计 量 X:- 一 这 与 前 面 的 
检验 统计 量 相同 。 因 此 需要 计算 : 


用 每 一 个 观察 频数 减 去 期 萤 频 数 ， 所 


。 得 结果 求 平 方 . 再 除 以 期 旱 频 数 ， 最 
> CMe 8, 


关键 是 : 务必 将 每 一 个 观察 频数 和 每 一 个 相应 的 期 望 频数 都 计算 在 内 。 
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继续 探讨 …… 


下 才 显 示 了 各 位 庄家 的 观察 频数 。 你 的 任务 是 算出 所 有 期 望 频数 。 












平 ”| 0yxesy/250=5.88 
| 赔 ”op1x98)/250=47.432 


求 出 所 有 期 望 频数 后 ， 计 算 检 验 统计 重 X*。 下 表 可 以 提供 帮助 : 第 一 列 给 出 了 所 有 观察 频数 ， 第 二 列 是 相应 
的 期 望 频 数 ， 只 要 将 第 三 列 的 所 有 数字 加 起 来 ， 就 可 以 得 到 检验 统计 量 。 





(O - Ej 之 __ 用 葡 直 列 掀 数值 可 以 帮助 你 
下 完成 计算 。 


{43-44.688)2/44.688 = 2.85/44.688 = 0.064 
ls |ss | (8-5.88)?/5.88 =4.4944/5.88 = 0.764 











A 入 
47.432 (47—47.432)3/47.432 = 0.187/47,432 = 0.004 
了 色 
C 
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练习 解答 


下 表 显 示 了 各 位 庄家 的 观察 频数 。 你 的 任务 是 算出 所 有 期 望 频数 。 









CE ET 
而 频 数 一 7 | 平 | sxeaj1250-588 
CT 


求 出 所 有 期 望 频数 后 ， 计 算 检验 统计 量 X?。 下 表 可 以 提供 帮助 ; 第 一 列 给 出 了 所 有 观察 频数 ， 第 二 列 是 相应 
的 期 望 频数 ， 只 破 将 第 三 列 的 所 有 数字 加 起 来 ， 就 可 以 得 到 检验 统计 重 。 


43 |44688 (43-44.688)2/44.688 = 2.85/44.688 = 0.064 
| mm rm 


(49-43.32)*/43.32 = 5.68/43.32 = 0.137 


BE {2-5.7)?/5.7 = 13.69/5.7 = 2.402 


(44-45.98)2:/45.98 = 3.9204/45.98 = 0.085 
(22-25.992):/25.992 = 15.936/25.992 = 0.613 
已. (5-3.42})2/3.42 = 2,4964/3.42 = 0.730 


(30-27.588)2/27.588 = 5.817/27.588 = 0.211 





2 网 洽 验 统计 量 
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继续 探讨 ee 


我 们 还 需要 计算 自由 度 


为 了 用 X 分 布 求 观 察 频数 的 显著 性 ， 还 需求 出 最 后 一 个 值 : v， 即 自由 度 值 。 


前 面 讲 过 ， 自 由 度 是 在 考虑 限制 条 件 的 情况 下 ， 可 以 自由 选择 的 独立 信息 的 
数目 。 这 说 明 我 们 要 查看 有 多 少 个 需要 独立 计算 的 期 望 频 数 ， 再 减 去 限制 条 
件数 目 。 


首先 ， 让 我 们 求 要 计算 的 期 望 频数 的 总 数目 。 我 们 必须 算出 三 位 庄家 的 期 望 
频数 以 及 三 种 可 能 结果 ， 于 是 期 望 频数 为 3x3=9。 





对 于 每 一 行 每 一 列 ， 我 们 实际 上 只 需要 计算 两 个 期 望 频数 。 我 们 已 经 知道 总 频 
数 是 多 少 ， 因 此 可 以 选择 第 三 个 频数 ， 使 得 所 有 频数 相 加 等 于 正确 结果 。 也 就 
是 说 ， 我 们 其 实 只 需要 计算 其 中 4 个 期 望 频数 ， 其 余 5 个 频数 可 以 根据 已 知 的 总 
频数 进行 推导 。 


我 们 只 需要 计算 这 见 个 
频数 ， 其 余 的 则 可 以 借 
助 每 一 行 和 每 一 列 的 总 一 人 
频数 击 出 ， 


利用 合计 可 心事 
出 最 后 一 行 和 最 





由 于 必须 算出 4 个 期 望 频数 ， 于 是 自由 度 就 等 于 这 个 数目 一 - 共 需 要 计算 4 个 
独立 信息 ; 算出 这 些 频 数 后 ， 其 余 频 数 自然 就 知道 了 。 即 : v= 4。 


另 一 种 得 知 自 由 度 的 方法 是 : 我 们 总 共 需 要 计算 9 个 数值 ， 其 中 5 个 不 用 独立 
进行 计算 。 用 前 面 的 公式 可 计算 v=9-5=4。 


第 14 章 XX? 分布 591 


又 一 次 强化 练习 
加 强生 习 


以 1% 的 显著 性 水 平 进行 假设 检验 ， 看 看 赌局 结果 是 否 独立 于 坐庄 的 庄家 。 下 面 给 出 步骤 
提示 ， 不 过 别 忘 了 ， 有 些 结果 前 面 已 经 算出 来 了 。 


1. 确定 要 进行 检验 的 假设 及 其 备 择 假设 。 
2. 求 出 期 望 频数 和 自由 度 。 

3. 确定 用 于 做 决策 的 拒绝 域 。 

4. 计算 检验 统计 重 X?。 

5. 看 看 检验 统计 申 是 否 位 于 拒绝 域 以 内 。 
5. 作出 决策 。 
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继续 探讨 …… 
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又 一 次 强化 练习 解答 
gy 
以 1% 的 显著 性 水 平 进行 假设 检验 ， 看 看 赌局 结果 是 否 独立 于 坐庄 的 庄家 。 下 面 给 出 步骤 
提示 ， 不 过 别 记 了 ， 有 些 结果 前 面 已 经 算出 来 了 。 
4. 确定 要 进行 检验 的 假设 及 其 备 择 假 设 。 
2. 求 出 期 望 频数 和 自由 度 。 
3. 确定 用 于 做 决策 的 拒绝 域 。 
4. 计算 检验 统计 量 X?。 
5. 看 看 检验 统计 量 是 否 位 于 拒绝 域 以 内 。 
6. 作出 决策 。 





第 7 步 : 
我 们 要 检验 赌局 输赢 结果 是 否 和 独立 于 坐 首 的 准 家 ， 于 是 ， 


Ho 同 局 输赢 结果 和 宴 关 的 左 家 没有 关系 。 
th 竺 局 答 赢 结 水 和 亚 疾 有 拘 疾 家 有 关东 


第 2 步 ， 
我 们 在 590 页 刷 出 了 期 电 频 数 ， 和 并 得 出 自由 度 为 +。 


第 3 步 ， 
从 概率 表 查 出 内 ,5(4) = 13.28， 因 尼 拒 绝 域 由 X2 > 13.28 决 完 。 


第 4 步 ; 
在 590 页 我 们 还 用 期 撒 频 数 算出 了 Xz = 5.004。 


第 5 步 : 
拒绝 埃 由 X2 > 13.28 给 出 ， 因 此 X: 信 于 拒 计 域 以 外 。 


第 6 步 ; 
由 于 xz 伞 于 拒绝 域 以 外 ， 间 此 我 们 接受 原 假 设 ， 没 有 足 蜗 拘 证 据 证 明 财 局 结果 和 并 家 之 网 有 关 素 ， 
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阅 :我 还 是 不 太 确 定 自己 是 否 
解 了 庄家 自由 度 的 算法 。 为 什么 有 4 
个 自由 度 ? 


答 : 自由 度 是 这 样 计算 的 : 查 
看 需要 计算 几 个 期 望 频数 ， 然 后 再 
看 这 些 频数 中 有 几 个 能 够 仅仅 通过 
观察 每 一 列 和 每 一 行 的 观察 频数 合 
计 即 可 得 出 。 


问题 中 包含 三 名 庄家 ， 三 组 结果 ， 


如 果 用 列 联 表 进 行 计 算 ， 则 各 列 和 
各 行 的 期 望 频数 合计 必须 等 于 观察 
频数 合计 。 这 说 明 ， 只 要 算出 任意 
行 或 任意 列 的 前 2 个 频数 ， 就 可 以 
通过 合计 求 出 最 后 一 个 频数 。 因 此 ， 
完全 自行 进行 计算 的 频数 只 有 2x2， 
因此 自由 度 为 4。 





世上 没有 俐 问题 


阅 : ”除了 拟 合 优 度 检验 和 独立 性 
检验 ，x' 分 布 还 有 其 他 用 途 吗 ? 


答 : 


XX 分布 主要 就 是 这 两 种 用 


途 ， 记 住 ， 你 几乎 可 以 用 它 检 验 任 
意 概 率 分 布 的 拟 合 优 度 。 例 如 ， 可 
以 检验 观察 频数 是 否 符合 特定 二 项 
分 布 










何事 出 自由 度 ? 


再 翻 到 下 一 页 。 


我 在 起 吕 果 列 联 表 大 小 发 


生变 化 该 怎么 办 ? 这 时 出 


7 动 动 防 


查看 我 们 在 计算 3x3 列 联 表 时 的 做 法 ， 你 党 得 可 以 
如 何 进行 归纳 ? 先 自己 想 想 能 不 能 找到 办 法 ， 然 后 


继续 探讨 …… 


| 问 : 我 应 该 以 任意 显著 性 水 平 进 
行 检验 吗 ? 

签 。 看 情况 。 与 其 他 假设 检验 
为 了 拒绝 


一 样 ， 显 著 性 水 平 越 小 ， 
原 假设 所 需要 的 证 据 越 强 


检验 时 常用 的 显著 性 水 平 为 5% 和 
1%。 
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向 由 度 的 通用 计算 方法 


自由 度 计算 方法 归纳 
前 面 讲 到 3 x 3 列 联 表 的 自由 度 计 算 ， 如 何 归 纳 这 个 算法 呢 ? 


假设 你 正在 对 两 个 变量 进行 比较 ， 且 一 个 变量 有 h 行 ， 另 一 个 变量 有 k 列 ， 
行 和 列 的 合计 有 办 法 知道 。 假 设 要 求 自由 度 的 数目 。 





每 一 行 都 对 应 着 k 列 。 你 有 办 法 知道 每 一 行 的 合计 ， 因 此 实际 上 只 要 算出 
(k-1) 列 就 行 了 ， 由 于 该 行 的 总 频数 已 知 ， 因 此 第 k 列 自然 就 会 知道 。 


利用 该 行 合计 ， 
Weak i 市 只 第 RR 列 。 





这 些 是 需要 计 兽 抑 


列 的 计算 与 此 相似 。 每 一 列 都 对 应 h 行 ， 你 有 办 法 知道 每 一 列 的 合计 ， 
因此 可 以 算出 (h-1) 行 ， 由 于 该 列 的 总 频数 已 知 ， 因 此 第 h 行 自然 就 
会 知道 。 


你 党 要 计算 n-1 行 拘 
频数 . 





你 可 以 用 列 合计 算 中 
第 h 行 ， 
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继续 探讨 …… 


得 出 算式 …-… 


综合 以 上 结果 ， 禹 要 计算 的 期 望 频 数 的 总 数目 为 (Kk~1)x(h-1)， 即 ， 
如 果 有 一 张大 小 为 h x k 的 表格 ,就 可 以 通过 下 列 算 式 得 出 自由 度 : 


v= (h -1) x (k-1) 





i 必 颁 计算 (n-1) x (R-1) 个 期 癌 频 
PN 男 此 自由 度 为 (1-1) x {R-1) 。 


肥 蛋 又 招聘 了 两 名 上 庄家。 现在 自由 度 是 多 少 ? 赌局 结果 保持 
不 变 。 
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~ 下 解答 


由 于 肥 秋 又 招聘 了 而 名 并 家 ， 因 此 列 联 素 食 汉 3x5。 





肥 蛋 又 招聘 了 两 名 庄家 。 现 在 自由 度 是 多 少 ? 赌局 结果 保持 
不 变 。 








他 、B、C 是 原来 的 壮 家 ， 肥 过 
了 网 名 址 家 . 


自由 度 算 式 泊 (hn-1) x {R-1)， 其 中 h 汽 行 数 ， 民 注 列 数 ， 于 是 ， 
VvV=2Zx4 


二 如 





s ”通过 X? 分 布 可 以 进行 拟 合 优 度 检验 和 变量 独立 ”mm ”如 果 在 X? 分 布 中 用 X? 作 为 检验 统计 量 ， 则 写 

性 检验 。 作 : 
ee 

s ”检验 统计 看 为 3 


其 中 v 为 自由 度 ，c 为 显著 性 水 平 。 
在 拟 合 优 度 检验 中 ，v 等 于 组 数 减 去 限制 数 。 


在 两 个 变量 的 独立 性 检验 中 ， 若 列 联 表 为 h 行 
kK 列 ， 则 : 
v= (h-1) x (k~1) 


(OQ -EY 
x 


其 中 O 指 的 是 观察 频数 ，E 指 的 是 期 望 频数 。 
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继续 探讨 …… 


你 救 了 肥 蛋 赌场 

多 亏 你 精通 六 分 布 ， 你 刨 根 究 底 地 调查 被 动 过 手脚 的 赌 具 ， 对 实际 结 
果 和 期 望 结 果 之 间 的 可 解释 差异 进行 了 辨析 ， 还 以 一 定 显 著 性 水 平 
研究 了 可 疑 的 行为 。 

你 的 工作 让 肥 蛋 开心 起 来 。 谢 谢 ! 肥 和 蛋 现在 知道 哪个 赌博 游戏 需要 
调查 ， 而 庄家 们 则 保住 了 自己 的 饭碗。 下 一 次 来 这 里 的 时 候 要 通知 
肥 和 蛋 哦 ， 他 将 多 给 你 一 些 筹码 一 分 文 不 取 


Ss 


干 得 漂亮 ! 





Es jelels Hl [lel2W el 






一 


© 肥 蛋 承诺 免费 给 你 一 扒 
赌场 筹码 ! 
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收 忻 练习 


“加强 适 习 






肥 蛋 觉得 有 一 个 或 多 个 庄家 在 控制 轮 盘 赌 的 结果 ， 下 面 是 关于 每 一 位 庄家 的 停 球 颜色 的 观察 频 
数 数据 。 请 以 5% 的 置信 度 进行 检验 ， 看 看 球 位 颜色 是 否 与 庄家 相互 独 立 ,， 或 者 说 ， 是 否 有 足 
够 证 据 证 明 可 能 存在 隐情 。 





第 1 步 ; 决定 要 进行 检验 的 假设 及 其 备 择 假 设 。 


第 2 步 : 使 用 下 列 期 记 频 数 束 ， 求 期 望 频数 和 自由 度 。 
提示 : 篆 先 填写 各 行 、 各 列 网 合计 值 ， 这 些 
2 合计 值 与 前 面 的 观察 频 数 合计 什 是 相同 的 . 


1 


有 
077x80012300=3746 | EE 
M2980012300-431 | | 

[| EE 


条。 | opera |10007707730073536 
Ci 
名 | 





第 3 步 : 确定 用 于 决策 的 拒绝 域 。 
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第 4 步 : 利用 下 囊 ， 计 算 检 验 统计 量 X ?2。 


375 |3823 |G75-382.3)/382.3=53.29/382.3=0.139 
、 





第 5 步 : 查看 检验 统计 量 是 否 位 于 拒绝 域 以 内 。 


第 6 步 : 作出 决策 。 
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收尾 练 当 解 签 


加 吕 詹 习 
解答 









肥 蛋 觉得 有 一 个 或 多 个 庄家 在 控制 轮 盘 赌 的 结果 ， 下 面 是 关于 每 一 位 庄家 的 停 球 颜色 的 观察 频 
数 数据 。 请 以 5% 的 置信 度 进行 检验 ， 看 看 球 位 颜色 是 否 与 证 家 相互 独立 ， 或 者 说 ,是否 有 是 
够 证 据 证 明 可 能 存在 隐情 。 





第 1 步 : 决定 要 进行 检验 的 假设 及 其 备 择 假设 。 
你 要 检验 妹 倍 额 色 是 否 与 着 家 补 到 和 莉 立 ， 因 尼 ， 
Ho， 轮 盘 球 位 颜色 与 省 认 相 委 釉 立 . 
HH,: 蒜 位 闫 色 与 发 家 板 互 未 神 立 


第 2 步 : 使 用 下 列 期 望 频数 训 ， 求 期 望 频数 和 自由 度 。 
将 每 一 行 与 短 一 列 网 合计 相 乘 ， 再 除 以 总 和 ， 得 出 期 旦 频数 ， 


IE | [age [er 
room300-3873 | i0974077300-3556 [1099776077300=303 | | 
00 


B 
共有 3 行 3 列 ， 用 ( 行 数 -) 乘 以 ( 列 数 - 1)， 福 到 自由 度 ， 
v=2x2 





第 3 步 : 确定 用 于 决策 的 拒绝 域 。 
从 投 率 表 查 福 X sx(4) = 9.49， 于 是 拒绝 域 由 X” > 9.49 决 定 ， 
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继续 探讨 …… 










第 4 步 : 利用 下 表 ， 计 算 检验 统计 量 X 2。 


入 
> 
《37-39.9)2/39.9 = 8.41/39.9 = 0.211 
(357~363.1)°/363.1 = 37.21/363.1 = 0.102 
c (362-355.9)2/355.9 = 37.21/355.9 = 0.105 


{41-41)2/41 = 0/41 =0 





这 泰 示 检验 统计 重 孝 X? = 1.583。 


第 5 步 : 查看 检验 统计 量 是 否 位 于 拒绝 域 以 内 。 
碟 续 域 由 X: > 9.48 给 定 ， 由 于 X? = 1.583， 因 此 检验 统计 量 位 于 拒绝 域 必 外 。 


第 6 步 : 作出 决策 。 


由 于 检验 统计 重 位 于 拒绝 域 以 外 ， 因 此 在 星 着 性 水 平 为 5 名 的 情况 下 ， 没 有 兖 足 的 理由 可 以 拒绝 原 候 设 。 即 ， 
接 有 原 颁 设 ; 妹 位 般配 和 并 演 桐 去 独立 。 
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15 相关 与 间 归 


,我 的 线条 如 何 ? + 


我 用 砂纸 打磨 的 次 数 
越 多 ， 他 盐 不 容易 注 
意 到 我 的 汗毛 茬 儿 ， 










你 是 否 曾经 为 某 两 件 事 的 相互 关系 困惑 不 已 ? 

前 面 讲 过 的 统计 量 只 描述 一 个 变量 -一 如 个 人 身高 、 篮 球 队员 得 分 或 是 糖 球 口味 持 
续 时 间 ， 但 是 ， 另 外 还 有 一 些 统计 量 可 以 说 明 变 量 之 间 的 关系 。 了 解 事物 的 相互 关 
系 可 以 丰富 你 的 信息 ， 让 你 了 解 真相 ， 使 你 立 于 不 败 之 地 。 来 吧 ， 让 我 们 为 你 介绍 
发 现 事物 关系 的 秘诀 相关 与 回归 。 


进入 新 的 篇 章 。 605 


天 晴 一 一 出 席 人 数 关 系 


尔 远 不 要 相信 天 气 


露天 音乐 会 是 最 棒 的 音乐 会 一 起 码 这 两 位 帅哥 是 这 么 想 的 ， 
他 们 承接 组 织 一 场 商业 性 露天 音乐 会 ， 夏季 的 票房 看 来 有 大 
卖 的 希望 。 











今天 的 音乐 会 有 望 成 为 演出 以 来 的 最 佳 场 次 ,乐队 已 经 开始 练 
习 。 只 是 ， 天 边 飘 来 一 片 乌 云 …… 好听! 可 是 你 看 那 


边 一 是 不 是 降雨 
云 啊 ? 


不 消 片刻 ， 天 色 阴 沉 下 来 ,气温 又 降 ， 雨 似乎 要 下 起 来 了 。 更 糟 
糕 的 是 ， 票房 受 创 ， 小 伙 子 们 麻烦 了 ， 再 出 这 种 事 他 们 可 赔 不 起 。 
小 伙 子 们 希望 自己 能 够 根据 预计 天 晴 时 数 ( 小 时 ) 预测 出 音乐 会 
听众 人 数 。 这 样 一 来 ， 他 们 就 可 以 衡量 阴 天 可 能 给 听众 人 数 造 成 
的 影响 。 如 果 听 众人 数 将 少 于 3,500 人 一 这 时 票房 收入 将 无 法 抵 
消 成 本 费用 ， 那 么 他 们 就 取消 音乐 会 。 

他 们 需要 你 帮 有 帮忙 
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我 的 线条 如 何 ? 


让 我 们 分 析 天 晴 时 数 和 听众 人 数 


下 面 是 样本 数据 ,给 出 了 不 同 场 次 的 预计 天 晴 时 数 和 音乐 会 听众 人 数 
的 关系 数据 。 利 用 这 些 数据 ， 我 们 如 何苦 于 当天 预计 天 晴 时 数 ( 小 
时 ) 估计 出 票 情 况 ? 


ET TT 9 [as [313s Tr7 [ss Ts [72 | 





青 乐 会 听众 人 数 ( 百 人) 22 |33 |30 |42 [38 |49 [42 15s | 






这 简章 。 我 们 可 以 天 均 值 、 标 浴 莽 ， 
再 观察 分 市， 那样 就 全 都 隧 荡 了 . 







大 多 数 时候 ， 我 们 只 需要 如 此 这 般 行事 就 能 预测 各 种 可 能 结果 。 

这 一 次 的 问题 在 于 ， 我 们 该 求 哪些 数据 的 均值 和 标准 差 ? 我 们 该 以 音乐 会 
听众 人 数 作 为 计算 基础 ， 还 是 该 以 天 晴 时 数 作为 计算 基础 ? 二 者 都 没有 给 
出 我 们 所 需要 的 全 部 信息 一 我 们 不 能 只 使 用 一 组 数据 ， 而 是 两 组 数据 都 
蓝 使 用 。 

前 面 我 们 只 讲 过 独立 随机 变量 ， 相 关 变 量 还 没有 讲 到 。 我 们 可 以 假设 ， 如 
果 天 气 不 好 ， 则 露天 音乐 会 出 现 高 上 座 率 的 概率 将 比 天 气 好 时 的 概率 低 。 
可 是 我 们 如 何 为 这 种 关系 建立 模型 呢 ” 我 们 如 何 利用 这 个 模型 按照 天 晴 时 
数 预测 听众 上 座 率 呢 ? 


这 取决 于 数据 类 型 。 


动 动 及 


你 会 如 何 建立 模型 描述 两 组 数据 的 关系 ? 
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认识 二 变量 数据 


数据 类 型 探讨 


迄今 为 止 ， 我 们 所 使 用 的 变量 都 是 单 变量 。 


单 变 悬 数据 考虑 的 是 一 个 单一 变量 的 频数 或 概率 ， 例 如 ， 单 变量 数据 可 以 描述 
赠 场 收益 或 是 统计 邦 新 娘 的 体重 ， 在 这 两 种 情况 下 ， 所 描述 的 对 象 各 只 有 一 种 。 


单 变 量 数据 无 法 显示 多 组 数据 之 间 的 关系 ， 例 如 ， 如 果 用 一 个 单 变量 数据 描 
述 一 场 露天 音乐 会 的 听众 人 数 ， 那 么 这 个 变量 无 法 说 明 当 天 预计 天 晴 时 数 的 
任何 情况 ， 而 只 能 给 出 音乐 会 听众 人 数 。 


过 天 音 系 会 嘻 众 人 后 







音乐 会 听众 人 数 这 个 单 变 重 无 法 
/说明 天 上 时 数 欣 位 何 影响 


听众 人 数 


所 以 ， 如 果 我 们 需要 了 解 不 同 变量 之 间 的 关系 ,该 怎么 办 ? 尽管 单 变量 无 法 
为 我 们 提供 这 类 信息 ， 却 有 另 一 种 类 型 的 数据 能 够 办 到 一 二 变量 数据 。 


二 变量 数据 而 面 观 
对 于 每 一 个 观察 结果 ， 二 变量 数据 给 出 两 个 变量 数值 一 而 不 是 一 个 ， 例 如 ， 
对 于 同一 场 音乐 会 ， 或 者 说 对 于 同一 个 观察 结果 ， 二 变量 数据 会 同时 给 出 预 机 各 人吉 六 同一 个 观察 阁 时 
计 天 晴 时 数 和 音乐 会 听众 人 数 ， 如 下 所 示 : 2 支 量 数值 
天 晴 时 数 ( 小 时 ) 19 [25 [32 [38 [47 [ss [se [72 | 
冀 乐 会 听众 人 数 (百人 ) 2 [33 |30 |42 [38 le [a2 [ss | 


如 果 其 中 一 个 变量 以 某 种 方式 受到 控制 ， 或 者 被 用 来 解释 另 一 个 变量 ， 则 这 
个 变量 被 称 为 自 变量 或 解释 变量 ， 另 一 个 变量 则 称 为 因 变量 或 反应 变量 。 在 
以 上 的 例子 中 ,我 们 希望 用 天 晴 时 数 预 测 听 众人 数 ， 所 以 天 晴 时 数 是 自 变量 ， 
昕 众人 数 是 因 变 量 。 
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我 的 线条 如 何 ? 


三 变量 数据 可 视 化 


像 绘 制 单 变量 数据 图 形 一 样 ， 你 可 以 绘制 二 变量 数据 图 形 ， 借 此 了 解数 
据 模式 。 这 种 图 不 是 依照 频数 或 概率 绘制 数值 ， 而 是 以 x 轴 措 述 一 个 变量 ， 
以 y 轴 描述 另 一 个 相应 变量 。 指 助 这 种 图 可 以 以 可 视 方式 体现 两 个 变量 之 
间 的 关系 。 


这 种 岁 叫做 散 点 图 或 散布 图 ， 其 绘制 方法 与 其 他 图 形 的 绘制 方法 相似 。 


先 画 两 条 轴 一 横 轴 和 纵 轴 ， 用 x 表示 一 个 变量 ,用 y 表 示 另 一 个 变量 。 自 
变量 通常 用 x 轴 表 示 ， 因 变量 用 y 轴 表示 。 夯 出 坐标 轴 后 ， 取 每 个 观察 结 
果 的 数值 ， 将 它们 画 在 散 点 图 上 。 


下 面 这 张 散 点 图 显示 了 一 场 音 乐 会 或 一 个 观察 结果 中 的 天 晴 时 数 与 音乐 会 
听众 人 数 的 关系 ， 由 于 预计 天 畏 时 数 为 自 变量 ， 我 们 将 它 标 在 x 轴 上 ， 音 
乐 会 听众 人 数 为 因 变 量 ， 因 此 用 y 轴 表示 。 


天 贱 时 数 画 站 x 灶 
二 ， 听 友人 数 画 在 


据 在 比 ， 
x 《天 随时 数 ) |19 [25 [32 [38 [47 [55 |59 [72 |]k 一 兰 
y 犁 上 . |y (mAA) [22 133 [30 [a2 [3 [49 [42 [55 





音乐 会 听众 人 数 和 与 天 晴 时 数 
60 
xX 
中 友人 数 肝 人 40 x x 
二 x 
ee oy a 是 折 有 的 数据 点 ， 
百 
< 
一 一 一 一 二 一 一 一 大 里 时 数 几 x 轴 才 未 
天 了 畏 时 数 ( 小 时 ) 


你 能 看 出 散 点 图 如 何 帮助 你 将 数据 模式 可 视 化 吗 ? 


你 能 看 出 如 何 借助 这 张 图 确定 露天 音乐 会 听众 人 数 与 当天 预计 天 畏 时 数 之 
间 的 关系 吗 ? 
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610 
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Gy 
OO 


名 


是 
众 
人 
数 
百 
人 


当然 ， 我 们 还 没有 讲 过 如 何 分 析 二 变量 数据 ， 不 过 让 我 们 看 看 
你 是 否 能 为 音乐 会 组 织 者 深入 分 析 散 点 图 。 


你 从 图 中 看 出 了 什么 模式 ? 这 种 模式 与 基础 数据 有 和 何 关系 ? 如 果 
是 晴天 ， 你 对 于 笑 天 音乐 会 听众 人 数 有 何 期 望 ? 如 果 是 附 天 了 呢 ? 


音 系 合 吧 众人 数 惫 天 晴 时 数 
x 


x 
x * 


天 随时 数 (小 时 ) 





我 的 线条 如 何 ? 


素 件 : 防 耳 堪 销 建 


一 家 防 果 霜 厂 给 了 一 名 实习 生 一 个 任务 一 分 析 防 苯 条 销量 ,看 看 
如 何以 最 佳 方式 进行 品牌 营销 。 


实习 生 拿 到 了 一 大 堆 现 成 的 散 点 图 这些 散 点 图 针对 防晒 霜 销 量 和 
各 种 其 他 因素 建立 了 模型 。 厂 里 要 求 他 选 出 这 样 的 图 形 ; 图 上 的 
两 个 因素 看 上 去 存在 某 种 关系 。 这 对 销售 团队 有 帮助 。 


实习 生 找 出 的 第 一 张 图 所 绘制 的 是 当天 防晒 霜 销量 与 花粉 量 。 
他 惊讶 地 发 现 ， 若 花粉 量 高 ， 则 防晒 箱 销量 大 幅度 提高 。 他 决 
定 告诉 销售 团队 : 他 们 需要 考虑 在 广告 中 提 到 花粉 量 。 





销售 团队 听 了 他 的 建议 后 ， 一 脸 茫 然 地 看 着 他 。 你 觉得 销售 团队 应 
该 做 什么 ? 


花粉 量 多 会 促使 人 们 购买 防晒 霜 码 ? 
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动 动笔 解答 






当然 ， 我 们 还 没有 讲 过 如 何 分 析 二 变量 数据 ， 不 过 让 我 们 看 看 
你 是 否 能 为 音乐 会 组 织 者 深入 分 析 散 点 图 。 

你 从 图 中 看 出 了 什么 模式 ? 这 种 模式 与 基础 数据 有 何 关系 ? 如 果 
是 蚁 天 ， 你 对 于 露天 音乐 会 听众 人 数 有 何 期 望 ? 如 果 是 阴 天 也 ? 


时 站 
织 上 由 








音 系 才 吧 众人 装 务 灭 暑 时 刍 


Xx 













(加 ) 潜 >> 鸭 马 


天 睛 时 数 ( 小 时 ) 


首 光 ， 从 图 中 可 以 看 出 ， 数 据点 在 图 上 显 直 线 分 布 ， 且 这 条 线 随 天 量 时 数 增加 而 向 上 朴 升 ， 看 来 .如果 预计 
天 睛 时 数 相 对 镑 少 ， 则 音乐 会 听众 人 数 也 会 注 消 。 央 果 天 丹 时 数 增 加 .出 可 以 期 整理 乐 会 参与 人 人数 也 墙 加 . 
这 基本 上 说 明 ， 天 所 过 腾 闻 ， 有 预期 条 加 露天 音乐 会 的 人 就 会 战争 . 


有 一 个 量 点 需要 提 一 下 ,只 有 在 处 于 数据 范围 心 内 时 ， 我 们 才能 自信 地 给 出 这 个 结论 .如 果 天 胰 时 数 小 于 2zq 
峙 或 大 于 7.5 小 时 ， 赂 允 数 据 可 说 骨 是 何 措 忒 。 





散 点 图 为 你 指出 模式 


如 你 所 见 ， 散 点 图 的 作用 在 于 能 体现 数据 的 实际 模式 ， 通 过 散 点 图 ， 
你 可 以 愈 发 清晰 地 勾勒 出 两 个 变量 之 间 的 关系 一 如 果 确 实 存在 某 
种 关系 的 话 。 


音乐 会 数据 散 点 图 显示 出 一 种 独特 的 模式 一 数据 点 呈 直 线 分 布 ， 
我 们 将 这 种 现象 称 为 相关 。 
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我 的 线条 如 何 ? 


线性 相关 细 细 鼻 
散 点 周 显示 出 数据 对 之 间 的 相关 性 。 


相关 性 即 变量 之 间 的 数学 关系 ， 通 过 散 点 图 上 的 点 的 独特 构成 模式 ， 可 以 
识别 出 散 点 图 上 的 各 种 相关 性 。 如 果 散 点 图 上 的 点 几乎 呈 直 线 分 布 ， 则 相 
关 性 为 线性 。 


让 我 们 看 看 两 个 变量 之 间 的 相关 性 的 几 种 常见 类 型 ; 
正 线性 相关 


当 x 轴 上 的 低 端 值 对 应 y 轴 上 的 低 端 值 ， 同 时 x 轴 上 的 高 端 
值 对 应 y 轴 上 的 高 端 值 且 呈 直 线 分 布 时 ， 为 正 线性 相关 。 
即 随 着 x 增 长 ，y 也 呈现 增长 趋势 。 


所 绘制 次 代 表 x 和 的 点 
图 绕 在 一 条 直线 周转 


负 线 性 相关 
负 福 杀 ， 


f 在 入 地 下 当 x 轴 上 的 低 端 值 对 应 y 轴 上 的 高 端 值 ， 同 时 x 轴 上 的 高 端 
值 对 应 y 轴 上 的 低 端 值 且 呈 直线 分 布 时 ， 为 负 线 性 相关 。 


-es 即 随 着 x 增长 ，y 皇 现下 降 趋 势 。 


x 


这 张 图 显示 出 一 种 漳 
机 模式 ， 图 此 系 存 在 
相关 性 ， 


不 相关 


如 果 x 和 y 的 数值 呈现 出 一 种 随机 模式 ， 则 我 们 说 二 者 
不 相关 。 
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相关 关系 与 因果 关系 


相关 关系 与 因果 关系 











存在 相关 关系 是 否 意味 
着 一 个 变量 会 影响 另 一 
个 变量 ? 





咖啡 店 与 喝 生 让 


加 次 读 汗 蝙 
x 


两 个 变量 之 间 存 在 相关 关系 并 不 一 定 意味 着 一 个 变量 会 影响 另 一 个 变 
量 ， 也 不 意味 着 二 者 存在 实际 关系 。 

两 个 变量 之 间 的 相关 关系 意味 着 二 者 之 间 存 在 某 种 数学 关系 ， 即 ， 当 我 们 
在 图 上 绘制 数值 时 ， 我 们 能 够 看 出 某 种 模式 ， 并 能 够 预测 出 没有 出 现在 图 
上 的 数值 。 我 们 并 不 知道 两 个 变量 之 间 是 否 存在 实际 关系 ， 当 然 ， 我 们 也 
不 知道 一 个 变量 是 否 会 影响 另 一 个 变量 ， 或 是 否 有 其 他 因素 在 发 挥 作用 。 


举 个 例子 : 假设 你 收集 了 一 些 数据 并 发 现 ， 随 着 时 间 的 推移 ， 某 个 小 镇 上 
的 咖啡 店 的 数目 增多 了 ， 同 时 唱片 店 的 数目 减 小 了 。 这 可 能 的 确 是 实情 ， 
但 我 们 不 能 说 咖啡 店 数目 和 唱片 店 数目 之 间 有 什么 实在 的 关系 ， 即 ， 我 们 
不 能 说 咖啡 店 数目 的 增加 导致 了 唱片 店 数目 的 减 小 。 我 们 只 能 说 : 在 咖啡 
店 数目 的 增加 的 同时 ， 唱 片 店 的 数目 减少 了 。 


的 同时 ， 唱 片 店 
在 加 嘛 店 数目 增加 
数目 在 减 小 ， 但 这 并 未 意味 着 咖啡 


让 数 日 的 增加 导致 了 唱片 启 数 目的 
减 小 ， 





咖啡 店 数目 
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我 的 线条 如 何 ? 


破案 : 防 硒 霜 销 量 案例 
花粉 量 多 会 促使 人 们 购买 防晒 钉 吗 ? 
一 位 销售 员 走 到 实习 生 身边 。 


“谢谢 你 出 的 主意 。” 她 说 道 ，“ 可 是 我 们 不 打算 
用 它 做 广告 。 要 知道 ， 花 粉 量 多 不 会 促使 人 们 多 买 
防晒 箱 。” 





实习 生 困 惑 地 看 着 她 ，“ 可 散 点 图 上 不 是 明摆着 吗 ， 
粉 量 上 升 时 ， 防 硒 钉 销量 也 上 升 。” 


“确实 如 此 。” 销 售 员 说 道 ，“ 但 这 并 不 意味 着 花粉 量 多 会 导致 销量 
大 。 在 花粉 量 多 的 日 子 里 ， 通 常 天 气 晴好 ， 于 是 人 们 就 会 增加 户外 活 
动 ， 人 们 多 买 防晒 着 是 因为 他 们 在 进行 户外 活动 。” 
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世上 没有 傻 问题 










扯 远 了 ， 兄 第， 我 在 想 
天 睛 和 音乐 会 听众 人 数 
的 关系 呢 . 










世上 没有 傻 问题 


问 : 这 么 说 预计 天 睛 时 数 会 影响 票房 收入 ? 


签 : ”二 变量 数据 表明 两 个 变量 之 间 存 在 菜 种 数学 关 
系 ， 但 我 们 无 法 用 二 变量 数据 证 明 原因 和 结果 。 赁 直 
觉 ， 若 天 气 睛 朗 ， 去 听 音 乐 会 的 人 会 增多 ， 但 我 们 不 
能 肯定 地 说 是 天 晴 造成 了 人 们 去 听 音 乐 会 。 我 们 还 需 
要 做 更 多 调查 ， 因 为 可 能 存在 其 他 因素 。 


问 :其 他 因素 ? 例如 ? 


答 :比如 参加 演出 的 艺术 家 的 名 气 。 如 果 一 位 著名 
艺术 家 正在 举办 一 场 音乐 会 ， 那 么 ， 无 论 天 气 如 何 ， 粉 
丝 们 都 会 去 听 音 乐 会 。 类 似 道理 ， 一 位 冷门 艺术 家 则 不 
可 能 受到 粉丝 们 的 同样 追 掉 。 
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阅 :” 散 点 图 用 的 是 总 体 数据 还 是 样本 数据 ? 


签 ;， 都 能 用 。 大 多 数 时 候 ， 你 实际 上 是 在 用 样本 ， 
但 无 论 是 用 样本 还 是 用 总 体 ， 绘 制 散 点 图 的 过 程 都 相同 。 


问 : 如 果 两 个 变量 之 间 有 关系 ， 必 须 是 线性 关系 吗 ? 


答 : 相关 性 量度 的 是 线性 关系 ， 但 并 不 是 所 有 关系 
都 是 线性 的 。 例 如 ， 两 个 变量 之 件 的 某 种 强 关 系 可 能 
是 一 条 特别 的 曲线 ,例如 y=x?。 不 过 ， 我 们 在 本 章 中 只 
介绍 线性 关系 。 











等 等 ， 兄 第 ! 我 们 此 何 根 据 
预计 天 晴 时 数 预测 音乐 会 听 
众人 数 ? 册 果 听众 人 数 小 于 
3,500， 我们 就 得 草 革 收场 ， 
这 就 异 了 ， 





~ 
我 们 需要 预测 音乐 会 听众 人 数 
前 面 讲 到 什么 是 二 变量 数据 ， 以 及 散 点 图 如 何 体现 两 个 变量 之 间 是 否 


存在 数学 关系 ， 不 过 还 没有 讲 过 如 何 利 用 散 点 图 进行 预测 


接 下 来 我 们 就 需要 看 看 ， 如 何 利 用 已 有 数据 根据 预计 天 上 晴 时 数 预 测 音 
乐 会 听众 人 数 


5 动 动 肪 


你 觉得 我 们 该 如 何 为 二 变量 数据 进行 这 类 预测 ? 
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最 佳 拟 合 线 


同 最 佳 氟 合 线 预测 数值 


前 面 讲 到 如 何 借助 散 点 图 看 出 是 否 存在 某 种 模式 ， 从 而 判定 数值 之 间 
是 否 存 在 关联 。 那 么 如 何 利用 散 点 图 根据 天 晴 时 数 预 测 音乐 会 听众 人 数 
呢 ? 一 在 已 知 当 天 天 晴 时 数 期 望 值 的 情况 下 ， 你 会 如 何 利用 现 有 散 点 
图 预测 音乐 会 听众 人 数 ? 


其 中 一 个 办 法 是 ， 在 散 点 图 上 画 一 条 穿 过 这 些 点 的 直线 ， 使 这 条 线 尽 量 
接近 各 个 点 。 你 无 法 令 这 条 直线 穿 过 每 一 个 点 ， 不 过 ， 若 存在 线性 相关 
性 ， 则 应 该 可 以 保证 每 一 个 点 合理 地 接近 你 所 绘制 的 直线 。 如 此 一 来 ， 


你 就 可 以 根据 预计 天 晴 时 数 找 出 音乐 会 人 数 的 估计 值 。 它 穿 过 
这 就 是 所 绘制 的 直线 ， 上 


性 了 数据 点 的 核心 位 置 。 





60 
这 是 原来 的 听 50 
教 点 图. 众 
" 和 区 和 2 汗 
百 你 可 以 利 用 这 条 和 线 ， 根 据 sh 
和 了 天 睹 时 数 估计 音乐 会 听众 人 数 ， 





0 1 2 3 4 5 6 了 8 


天 晴 时 数 ( 小 时 ) 


能 最 好 地 接近 所 有 数据 点 的 线 被 称 为 最 佳 拟 合 线 。 









最 住 拟 合 线 ? 只 要 看 着 顺眼 
就 能 生出 这 条 线 了 ? 这 可 谈 不 
上 科学 性 . 







用 这 种 方法 画 出 的 线 只 是 一 种 最 佳 猜 测 。 

用 以 上 方法 绘制 图 线 的 问题 在 于 : 这 只 是 一 个 估计 ， 因 此 根据 这 条 线 
做 出 的 任何 预测 都 值得 怀疑 。 你 没有 什么 精确 的 方法 量度 这 条 线 是 否 
确实 是 最 佳 匹 配 线 。 这 条 线 具 有 主观 性 ， 这 条 线 的 拟 合 质量 取决 于 你 
的 判断 。 
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最 佳 猜测 仍 是 猜测 


假想 你 请 三 个 人 按照 他 们 各 自 的 想法 画 出 音乐 会 听众 人 数 最 佳 拟 
合 线 ， 很 可 能 每 个 人 都 会 画 出 与 别人 略 有 差别 的 最 佳 拟 合 线 ， 如 


图 所 示 : 
这 蛙 线 各 趟 相同 ， 但 数 
上 一 各 关 础 相同 ， 丛 该 几 叶 


一 条 ? 


名 名 


Do 
[= 


m 
已 


( 疡 加) 沙沙 马 
xX 


a 
已 


0 1 2 3 4 5 6 了 


天 哺 时 数 ( 小 时 ) 


2 


这 三 条 线 都 可 以 想当然 地 被 认为 是 数据 的 最 佳 拟 合 线 ， 但 我 们 无 法 
知道 哪 一 条 线 是 名 副 其 实 的 最 佳 拟 合 线 。 


我 们 确实 需要 找 一 个 可 以 通过 目测 方式 绘制 最 佳 拟 合 线 的 办 法 。 这 
不 是 一 种 犹 测 方法 ， 而 是 一 种 更 可 靠 的 方法 一 使 用 数学 或 统计 方 
法 利用 手头 数据 去 找 出 最 佳 拟 合 线 。 


一 日 


我 们 需要 求 出 直线 公式 公认， 


我 的 线条 如 何 ? 


+ bx 为 直线 
其 中 0 和 b 均 


为 数字 。 


直线 的 公式 为 y = a + bx， 其 中 a 为 直线 与 y 轴 的 交点 ，b 为 直线 斜 
率 ， 于 是 我 们 可 以 用 公式 y = a + bx 表示 最 佳 拟 合 线 。 


在 我 们 的 例子 中 ,我 们 用 x 表示 预计 天 晴 时 数 。 用 y 表 示 相 应 的 
露天 音乐 会 听众 人 数 ， 只 要 我 们 能 用 音乐 会 听众 数据 求 出 a 和 b 
的 最 合适 数值 ， 就 有 可 靠 的 方法 求 出 直线 等 式 ， 且 能 够 以 更 为 
可 靠 的 方法 按照 预计 天 上 晴 时 数 预测 音乐 会 听众 人 数 。 a 


y=a+ bx 
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最 佳 拟 合 线 和 误差 平方 和 


我 们 需要 将 误差 最 小 化 


让 我 们 看 看 对 最 佳 拟 合 线 y = a + bx 的 要 求 。 

最 佳 拟 合 线 即 能 最 准确 地 预测 出 所 有 点 的 真实 值 的 线 。 即 ， 对 于 每 一 个 已 
知 的 x 值 ， 我 们 需要 让 数据 集中 的 每 个 y 变 量 尽 可 能 接近 我 们 通过 最 佳 拟 合 
线 估计 出 来 的 数值 。 即 ， 在 已 知 某 个 天 晴 时 数 时 ,我们 希望 自己 估计 的 
露天 音乐 会 听众 人 数 尽 可 能 接近 实际 值 。 


最 佳 拟 合 线 即 表达 式 为 y = a + bx 且 使 得 y 的 实际 观察 值 与 每 个 x 相 对 应 的 y 













的 估计 值 的 差距 为 最 小 的 线 。 
y 
y=a+ bx 
这 些 是 x .0 . 生僻 舍得 所 有 的 的 观察 从 
i 载 们 改观 这 条 线 ER 
实际 值 : 吃 ， 电 值 之 同 的 中 高 季 小 ， 骨 白 得 到 的 这 他 
这 些 值 是 同一 线 为 最 住所 合 色 ， 
个 x 秆 对 太阴 
y | 
的 实际 值 和 从 流出 是 根据 最 住 拟 合 
计 值 . 






让 我 们 用 y 表 示 数 据 集中 的 每 一 个 y 值 ， 用 y 表示 通过 最 佳 拟 合 线 得 出 
的 估计 值 。 这 种 表示 方法 与 前 面 章节 中 的 点 估计 量 的 表示 方法 一 致 ， 
因为 ^ 符 号 代表 估计 什 


我 们 想 让 y 的 实际 值 和 我 们 根据 最 佳 拟 合 线 得 出 的 估计 值 之 间 的 差 为 
最 小 ， 也 就 是 说 ， 我 们 想 让 y 与 的 差别 之 和 为 最 小 ， 试 算 如 下 : 





Zn - 






是 我 们 根据 
直线 估计 的 值 。 






可 是 ， 这 个 算式 的 问题 是 ,实际 上 所 有 的 距离 都 会 相互 抵消 。 我 们 
需要 稍微 调整 一 下 算法 一 这 个 算法 前 面 已 经 出 现 过 了 。 
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我 的 线条 如 何 ? 


已 二 三 

认识 误差 平方 和 

还 记得 我 们 第 一 次 推导 方差 的 时 候 吗 ? 我 们 希望 求 出 数据 组 中 的 数值 与 
均值 之 间 的 距离 之 和 ， 但 这 些 距离 却 相 互 抵消 。 为 了 解决 这 个 问题 ,我 
们 将 所 有 距离 先 求 平方 ， 然 后 加 总 ， 从 而 确保 所 有 数值 都 是 正 的 
现在 我 们 磁 到 了 类 似 的 情况 。 需 要 先 将 所 有 距离 求 平方 再 加 总 ， 而 不 是 
计算 一 对 对 实际 值 和 期 望 值 的 距离 之 和 。 这 样 我 们 就 能 保证 所 有 的 数值 
都 是 正 的 


距离 平方 之 和 被 称 为 误差 平方 和 ， 英 文 缩写 为 SSE。 算 式 如 下 : pe 
/ 纲 实 际 什 ' 必 及 通过 最 住 权 信 找 得 出 


Pp EE 的 预测 值 之 同 的 雇 ， 
“™ 3SS-E = >(y- y): 


即 ， 取 各 个 数值 y， 减 去 通过 最 佳 拟 合 线 得 出 的 y 的 预测 值 ， 求 其 平方 ， 
然后 将 所 有 平方 数 加 起 来 。 











SSE 让 我 们 想起 了 方差 . 方差 用 的 是 
数值 与 均值 的 距离 的 平方 ，SSE 用 的 
是 数值 与 直线 的 距离 鸥 平方 。 


方差 与 SSE 的 计算 方法 相似 。 
SSE 并 非 方差 ,不 过 ， 它 确实 涉及 两 个 特定 点 之 间 的 距离 的 平方 





给 出 了 y 的 实际 值 和 根据 最 佳 拟 合 线 得 出 的 y 的 预测 值 之 间 的 距离 的 平方 
之 和 





我 们 现在 需要 做 的 就 是 根据 y = a + bx 这 条 线 ， 求 出 使 得 SSE 最 小 的 a 和 b 
的 数值 。 





相关 与 回归 ”621 


计算 最 佳 拟 合 线 的 b 值 


求 又 佳 拟 合 线 公 式 


前 面 讲 到 我 们 想得到 误差 平方 和 Z(y - y): 为 最 小 的 直线 式 ， 其 中 y = a 
+ bx， 从 而 可 以 得 到 a 和 b 的 最 优 值 ， 进 而 得 到 最 佳 拟 合 线 公 式 。 


让 我 们 先 算 b 
y =a+ bx 中 的 b 代 表 这 条 直线 的 斜率 ， 或 者 叫 陡 度 ， 即 b 是 最 佳 拟 合 线 
的 斜率 。 


人 
我 们 就 不 进行 证 明了 ， 下 面 直接 给 出 使 得 2y - 分 为 最 小 的 b 值 ;每 一 个 x 值 去 (的 均值 可 和 
> ((x - x)(y - y)) 
三 5 (x - NY 
工法 一 用 条 个 数 -了 
的 场 值 ， 然 后 将 所 得 结果 进 


这 有 有 点 像 x 的 方差 胸 
值 x 减 去 x 
行 乎 方 ,. 






肯定 吗 ? 这 看 上 去 
很 复杂 . 


计算 初 看 很 复杂 ， 但 实际 上 并 不 那么 难 。 

首先 ， 求 出 x 和 y -一 手头 数据 的 x 均值 和 y 均 值 ， 此 后 ， 对 每 一 个 观察 结 
果 计 算 (x - x) 乘 以 (y - 7)， 然 后 将 结果 加 起 来 。 最 后 ， 用 整个 结果 除 以 
(x - Xx)*。 公 式 的 最 后 一 部 分 与 样本 方差 的 计算 方法 十 分 相似 ， 唯 一 的 
区 别 是 这 里 不 除 以 (n-1)。 你 也 可 以 利用 软件 完成 所 有 计算 。 


下 面 让 我 们 看 看 实际 运用 。 





几乎 可 以 肯定 会 给 出 这 个 公式 。 ” “: 
也 就 是 说 你 不 用 记 住 这 个 公式 ， 只 要 会 用 就 行 了 。: 
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我 的 线条 如 倍 ? 


求 最 佳 拟 合 线 斜 字 


让 我 们 看 看 能 否 用 以 上 公式 求 出 描述 音乐 会 数据 的 直线 y = a + bx 的 
斜率 ， 首 先 回顾 一 下 数据 : 


x (天 贱 时 数 ) “|19 |25 |32 |38 |47 |55 |59 |72 | 
y (听众 人 数 ) |2 |33 |30 |42 |38 |49 |42 |55 | 


让 我 们 先 求 x 和 y， 即 x 和 y 的 样本 均值 。 计 算 方 法 和 以 前 完全 一 样 ， 
即 : 












xX={l9+25+32+3.8+47+55+5.9+7.2)78 
=34.778 


利用 x 值 汞 X. 季 外 
= 4.3375 


vy 值 常 9- 
y=(22+33+30+42+38+49+42+55)/8 
= 311/8 
= 38.875 


求 出 x 和 3 以 后 ， 就 可 以 借助 这 些 值 用 本 页 前 一 页 的 公式 算出 b。 
借助 Xx 和 7 求 出 b 


公式 的 第 一 部 分 是 Z(x - x){y - 录 ， 为 此 我 们 取 各 个 观察 结果 的 x 值 和 
y 值 、 用 x 减 XK， 用 y 减 7， 然 后 将 两 个 差 相 乘 ， 对 每 个 观察 结果 完成 以 
上 计算 以 后 ， 肯 将 所 有 乘积 加 起 来 。 


Xx- WwW- 


Z(x - zy -7 = (19 - 4.3375)(22 - 38.75) + (2.5 - 4.3375)(33 - 38.75) + (3.2 - 4.3375)(30 - 38.75) + 
(3.8 ~ 4.3375)(42 - 38.75) + (4.7 - 4.3375)(38 - 38.75) + (5.5 - 4.3375)(49 - 38.75) + 
(7.2 - 4.3375)(55 - 38.75) 

= (~2.4375){(-16.75)+(-1.8375)(-5.875)+(-1.1375)(-8.875)+(-0.5375)(3.125)+ (0.3625)(-0.875)+ 

糙 急 一 组 数据 的 所 有 (1.1625){10.125) + (1.5625)(3.125) + (2.8625)(16.125)》 

丢 积 相 加 。. 


x ~ XY -YU) 


40.828125 + 10.7953125 + 10.0953125 -1.6796875 -0.3171875 + 11.7703125 + 4.8828125 + 
46.1578125 


122.53 (保留 2 位 小 数 ) 
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计算 最 佳 拟 合 线 b 值 ， 第 二 部 分 


求 聂 佳 拟 合 线 的 斜 字 ， 第 二 部 分 


下 面 是 音乐 会 听众 人 数 和 预计 天 晴 时 数 提示 : 


x (WN) [19 [25 [32 [3 [47 [5 [59 [72 





ly (MAMA) |22 |33 |30 |42 |38 | [12 |ss_ | 


我 们 正在 进行 y = a + bx 中 b 值 的 计算 。 我 们 已 求 得 x = 4.3375, 了 = 38.875， 
Z(x - xj(y - = 122.53。 最 后 要 求 的 是 Z(x - 习 :， 让 我 们 算 下 去 : 


这 是 公 冻 提示 -。 


Zt{x - XIy - y) 


2 (x =- x) 


、 了 ZK-R， 这 
副 们 用 各 个 x 伪 菠 出 ， “但 趟 多 


马 接 林 方 郑 哆 著 流 很 构 ， 


人 


Zlx ~- xX} =(1.9-43375) +(2.53-4.3375) + (3.2- 4.3375)?+ (3.8 -4.3375)? + (4.7 - 4.3375)? + (5.5 - 4.3375)2 + 


= (-2.4375)+ {-1.8375)? + (-1.1375)? + (-0.5375)? + (0.3625)? + {1.1625)? + (1.5625)? + (2.8625): 


注意 ， 这 里 
未 用 日 和 上. = 23.02 (保留 2 位 小 数 } 


用 Z(x - xX)(y 一 六 除 以 2(x - 妈 2?， 即 得 到 数值 b， 因 此 


b = 122.53/23.02 我 们 已 经 束 风 了 9， 由 此 得 到 最 住 


= 5.32 裤 合 伐 的 鲜 。 


即 ， 数 据 的 最 佳 拟 合 线 为 y = a + 5.32x。 不 过 ，a 是 多 少 呢 ? 
世上 没有 俐 问题 


阅 : 你 给 出 的 公式 看 上 去 是 针对 ” 陪 :数值 b 永 远 是 正 数 吗 ? 
样本 的 ， 不 是 针对 总 体 的 。 对 吗 ? 

; 不 一 定 。b 到 底 是 正 还 是 负 取 
决 于 线性 相关 类 型 ， 若 为 正 线性 相关 ， 
则 pb 为 正 ， 落 为 负 线性 相关 ， 则 为 负 。 


A 


只 : 对 。 我 们 用 了 样本 而 不 用 
总 体 ， 这 是 因为 我 们 手头 有 的 数据 
是 样本 数据 。 要 是 你 有 总 体 数 据 的 


话 ， 请 尽管 用 ， 只 要 用 几 代 普 双 就 ”上 联 : ”我 还 听 说 过 “ 陵 度 ”一 词 ， 
行 了 。 它 是 什么 意思 ? 
答 ; 寻 度 是 直线 射 素 b 的 另 一 个 
名 称 。 
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阅 :要 是 不 存在 相关 关系 怎么 
办 ? 我 还 能 算出 ba? 


签 : ”加 果 不 在 在 相关 关系 ， 你 
仍然 可 以 通过 技术 手段 求 出 最 佳 拟 
合 线 ， 但 这 不 是 教 据 的 有 效 模型 ， 
无 法 通过 这 个 寞 型 做 出 准确 预测 。 


| 问 :计算 b 有 简便 方法 吗 ? 
签 :; 如果 观测 结果 很 多 的 话 ， 


计算 b 十 分 本 弄 ， 不 过 你 可 以 借助 软 
件 进行 计算 。 


我 的 政委 如 条? 


b 求 出 来 了 ，a 呢 ? 


前 面 求 出 了 最 佳 拟 合 线 y = a + bx 的 最 佳 b 值 ， 可 是 我 们 还 不 知道 a 值 。 










我 肯定 ， 只 要 知道 
直线 所 经 过 网 一 个 
点 ， 就 能 求 出 a. 






直线 需要 穿 过 点 (xX, y). 
最 佳 拟 合 线 最 好 穿 过 x 和 y 的 均值 (X， 妨 ， 为 了 确保 这 一 点 、 我 们 用 x 和 y 
代入 直线 公式 y = a + bx。 得 到 : 


y=a+t+bx 


或 : ke 
a=y-bx “® 





我 们 已 经 求 出 了 x、y 和 b 的 值 ， 代 人 这 些 值 ， 得 : 


5 b x 


= 38.875 - 23.0755 
= 15.80 (保留 2 位 小 数 ) 


于 是 最 佳 拟 合 线 公 式 为 : 





得 用 就 行 了 ， 


y= 15.80 + 5.32x : ee Re NCE UCR PEO eR 






y= 15.80 + 5.32x 


7 


2 3 4 5 6 a 
天 随时 数 ( 小 时 ) x 


0 1 
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a = 38.875 - 532(43%5) 放浪 粹 


如 果 你 正在 参加 统计 学 考  : 
试 ， 可 能 会 给 出 这 个 公式 。: 
这 就 是 说 你 不 必 记 住 这 个 公式 ， 只 要 慌 : 
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最 小 二 乘 回归 法 细 绝 看 


最 小 二 乘 间 归 法 细 细 在 





我 们 用 于 求 出 最 佳 拟 合 线 的 数学 方法 称 为 最 小 二 乘 回归 法 。 


最 小 二 乘 回 归 法 是 一 种 数学 方法 ， 可 用 一 条 最 佳 拟 合 线 将 一 组 二 
变量 数据 拟 合 ， 通 过 将 公式 为 y = a +bx 的 一 条 直线 与 一 组 数值 相 
拟 合 ， 使 得 误差 平方 和 最 小 一 - 即 ， 使 得 实际 数值 与 这 些 数值 的 估 
计 值 之 间 的 差 值 最 小 。 误 差 平 方 和 的 公式 为 : 


SSE = 5 (y -Y)? 


为 了 对 一 组 数据 使 用 最 小 二 乘 回归 法 ， 需 要 求 出 a 和 b 的 值 ， y 6o 
使 数据 点 与 直线 y = a + bx 的 拟 合 度 最 大 ， 且 SSE 最 小 。a 和 
b 计 算 如 下 : 


50 


(x -x)(y -y) 
b = 一 


30 
(x -~ X): 


求 出 最 佳 拟 合 线 y = a + bx 之 后 ， 就 可 以 用 这 条 线 根据 已 知 的 x 值 
预测 y 值 ， 这 时 只 要 将 x 代入 等 式 y = a + bx 即 可 。 


直线 y = a + bx 被 称 为 回归 线 。 


在 预测 一 个 特定 x 值 对 应 的 y 值 时 ， 要 避免 对 

已 知 数据 点 范围 以 外 的 值 进行 预测 。 

线性 回归 法 只 是 根据 手头 拥有 的 信息 进行 估计 

的 一 种 方法 ， 它 体现 了 已 知 的 各 个 数据 点 之 间 
的 关系 ， 这 并 不 表示 它 也 适用 于 数据 限 值 以 外 的 范围 。 
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我 的 线条 如 何 ? 


我 们 已 经 求 出 了 回归 线 方程 式 ， 音 乐 会 组 织 者 在 此 有 两 个 问题 要 
请 教 你 。 下 面 再 提示 一 下 回归 线 公 式 : 

y = 15.80 + 5.32x 
其 中 x 是 预计 天 晴 时 数 ，y 是 音乐 会 听众 人 人数， 以 “百人 ”为 单位 。 


下 一 场 音 乐 会 当天 天 瞳 时 数 预计 为 6 小 时 ， 问 期 望 听众 人 数 是 多 少 ? 


如 果 音 乐 会 听众 人 数 会 在 3,500 人 人 以下， 音乐 会 组 织 者 将 没有 利润 ， 因 此 将 取消 音乐 会 。 问 相应 的 预计 天 上 晴 
时 数 为 多 少 ? 
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动 动笔 解答 


~、 解 带 我 们 已 经 求 出 了 回归 线 方程 式 ， 音 乐 会 组 织 者 在 此 有 两 个 问题 要 


请 教 你 。 下 面 再 提示 一 下 回归 线 公 式 : 
y = 15.80 + 5.32x 
其 中 x 是 预计 天 晴 时 数 ，y 是 音乐 会 听众 人 数 , 以 “百人 ”为 单位 。 


下 一 场 音乐 会 当天 天 晴 时 数 预 计 为 6 小 时 ， 问 期 望 听 众人 数 是 多 少 ? 


由 于 x 是 预计 环 睛 肝 数 ， 已 知 x=6。 我 们 需要 求 出 相应 的 音乐 会 听众 人 数 预 测 值 ， 也 就 是 要 求 这 个 x 值 对 
匡 鲍 yj 人 缠 。 
YU = 15.80 + 5.32x 
=15.80 + 5.32x6é 
= 15.80 + 31.92 


三 47.72 


由 于 UJ 的 单位 为 “百人 ”， 几 此 期 政 明 音 乐 会 听 众人 数 芍 47.72 x 100 = 4772。 


如 果 音 乐 会 听众 人 数 会 在 3,500 人 以 下 ， 音乐 会 组 织 者 将 没有 利润 ， 因 此 将 取消 音乐 会 。 问 相应 的 预计 天 本 
时 数 为 多 少 ? 
这 一 决 要 玉 的 是 特定 日 值 网 桐 驰 X 值 。 理 乐 会 听众 人 数 鸭 3500， 即 日 = 35， 于 是 ， 
4 = 15.80 十 5.32X 
35 = 15.80 + 5.32X 
35 一 15.80 = 与 .32X 
19.2 三 5.32X 
X= 19.2/5.32 
二 3.61 (保留 两 位 小 数 ) 
即 ， 我 们 预测 出 论 结 果 是 : 风 果 预计 天 晴 时 数 少 于 3.61 相 :时 ， 则 冲 乐 会 听众 人 数 将 低 于 3.500 人 ， 
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你 已 经 找 出 了 关系 


到 此 为 止 ， 你 已 经 使 用 线性 回归 法 建立 了 预计 天 晴 时 数 与 音乐 会 听众 人 
数 之 间 的 关系 模型 。 利 用 y = a + bx， 只 要 知道 预计 天 晴 时 数 ， 就 能 预测 
出 音乐 会 听众 人 数 


能 够 预测 听众 人 数 意 味 着 你 将 能 切实 帮助 音乐 会 组 织 者 了 解 能 够 对 票房 
寄 子 多 大 期 望 ， 他 们 还 能 在 合理 范围 内 期 竺 每 场 演出 能 够 实现 的 利润 


太 丙 了， 兄弟 ! 不 过 我 得 问 一 问 一 - 


这 种 预测 到 底 有 多 准确 ? 





尽管 美 其 名 日 “最 佳 拟 合 线 ”， 我 们 却 并 不 知道 这 条 线 的 准确 

性 如 何 。 

直线 y = a + bx 是 我 们 能 够 得 出 的 最 佳 拟 合 线 ， 但 若 以 它 为 模型 描述 
天 晴 时 数 与 音乐 会 听众 之 间 的 关系 ， 准 确 性 大 吗 ? -一 还 有 一 事 需 
要 考虑 : 回归 线 的 相关 性 强度 


切实 有 用 的 做 法 是 ， 找 到 某 种 办 法 .指出 各 个 点 偏离 直线 的 距离 ， 
这 会 告诉 我 们 根据 已 知 条 件 得 出 的 期 望 结 果 到 底 有 多 大 的 精确 性 


让 我 们 看 几 个 例子 


… 动 动脑 








你 为 什么 认为 了 解 相关 强度 十 分 重要 ? 你 觉得 这 会 给 音乐 会 组 织 者 带 来 什么 影响 ? 
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相关 类 型 


证 我 们 过 希 一 些 相关 关系 
一 组 数据 的 最 佳 拟 合 线 是 我 们 所 能 得 出 的 可 作为 两 个 变量 之 问 数 学 关系 
模型 的 最 佳 直线 。 


尽管 最 佳 拟 合 线 是 与 数据 拟 合 程 度 最 高 的 直线 ,但 它 并 不 可 能 与 每 一 
个 点 都 精确 拟 合 。 让 我 们 观察 几 组 数据 ， 看 看 直线 与 数据 的 拟 合 情况 。 


精确 线性 相关 


这 一 组 数据 的 线性 相关 性 呈现 出 精确 的 数据 拟 合 。 
回归 线 并 非 百 分 之 百 完美 , 但 几 近 如 此 。 很 可 能 依 
据 这 条 线 做 出 的 任何 预测 都 是 准确 的 。 


XX* ~x 非 线性 相关 


这 一 组 数据 未 体现 出 线性 相关 性 。 你 可 能 能 用 最 小 二 
乘 回归 法 算出 一 条 回归 线 ， 但 据 此 做 出 的 任何 预测 
都 不 太 可 能 准确 。 





在 哪 忆 ? 


你 能 发 现 问题 所 在 吗 ? 


两 组 数据 都 有 回归 线 ， 但 数据 的 实际 拟 合 程度 却 大 不 相同 。 第 一 组 数 
据 的 相关 性 十 分 明显 ,但 第 二 组 数据 十 分 分 散 ， 以 至 个 归 线 丧失 应 有 
的 作用 。 


最 小 二 乘 估计 可 用 于 预测 数值 也 就 是 说 ， 如 果 有 某 种 方法 能 够 指出 
数据 点 与 直线 的 拟 合 程度 ， 同 时 能 指出 我 们 的 期 望 预测 结果 能 够 达到 
的 精确 程度 ， 那 么 最 小 二 乘 估计 就 能 发 挥 作用 。 


有 一 种 方法 可 用 于 计算 直线 拟 合 度 一 称 为 相关 系数 。 
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我 的 线 荣 如 何 ? 


用 相关 系数 衡量 直线 与 数据 的 所 合 度 


相关 系数 是 介 于 -1 和 1 之 间 的 一 个 数 、 描 述 了 各 个 数据 点 与 直线 的 偏离 程度 。 
通过 它 可 以 量度 回归 线 与 数据 的 拟 合 度 ， 通 常用 字母 表示 。 


如 果 r 等 于 -1. 则 数据 为 完全 负 线 性 相关 .所 有 数据 点 都 在 一 条 直线 上 : 如 
果 r 等 于 1， 则 数据 完全 正 线性 相关 。 如 果 r 等 于 0， 则 不 存在 相关 性 。 





-1、0 和 1 均 为 极 值 ， 通 常 z 为 介 于 这 几 个 极 值 之 间 的 数值 : 


如 果 r 为 负 ， 则 两 个 变量 之 间 存 在 负 线性 相关 。r 越 接近 -1， 
相关 性 越 强 ， 数 据点 距离 直线 越 近 。 


如 果 r 为 正 ， 则 两 个 变量 之 间 存 在 正 线 性 相关 。r 越 接近 1， 
相关 性 越 强 。 










我 是 相关 素数 上 ， 我 
说 明 两 个 变量 之 阅 的 
相关 性 的 强 玛 程度 ， 


总 之 ， 随 着 [向 0 靠近 ， 线 性 相关 性 变 弱 。 于 是 回归 线 无 法 
像 r 接 近 1 或 接近 -1 时 那样 准确 地 预测 y 值 ,数据 模式 可 能 会 0 
随机 变化 ， 或 者 说 变量 之 间 的 关系 可 能 是 非 线性 的 。 

如 果 我 们 能 算出 音乐 会 数据 的 r 值 就 会 得 知 我 们 根据 预 . 

计 天 晴 时 数 预 测 出 的 音乐 会 听众 人 数 的 准确 性 。 如 何 计算 把 r 当 作 相 总 关 素 
r? 下 一 页 将 进行 讲解 。 被 名 按 . 
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计算 相关 系数 


相关 系数 rF 有 专用 计算 公式 
我 们 如 何 计算 相关 系数 r? 
我 们 不 打算 在 此 进行 证 明 ， 相 关系 数 公 式 如 下 : 





b 是 已 求 出 攀 最 仁 cu 是 样本 中 次 x 值 网 标准 差 ， 

出 住 ~ Sx { 

拟 合 线 斜率 r= b Sx < ,是 中 值 的 标准 老 。 
ee 


其 中 s, 是 样本 中 的 x 值 的 标准 差 ，s, 是 其 中 y 值 的 标准 差 





明 饭 了， 我 们 借助 
b 值 计算 r。 







我 们 已 经 完成 了 大 部 分 工作 。 

由 于 我 们 已 经 算出 了 b， 剩 下 的 就 是 求 S\. 和 S$, 了 。 另 外， 我 们 已 经 完成 了 
大 部 分 求 S, 的 步 又 

在 计算 b 的 时 候 ， 我们 需要 求 出 (x-x)* 的 数值 。 如 果 将 这 个 结果 除 以 
n-1， 实 际 上 就 会 得 出 x 值 的 样本 方差 .如 果 取 其 平方 根 ， 则 得 到 S、 
即 : 


这 是 禅 和夫 中 的 


“ 值 的 标准 类 ， 和 2 (x - X)? ~ i 

前 讲 过 商人 文 旭 同 要 ， 王 CR 们 己 径 在 获 面 算 过 妆 … 

之 NYA 式 和 相同 x Ww 九重 第 
n-1 值 了 图 光 系 必 有 在 . 


方程 中 唯一 还 需要 计算 的 就 是 $y 一 样本 中 的 y 值 的 标准 差 。 其 计算 方法 与 
S$: 的 计算 方法 相似 : 





z(y - ye€ 这 是 样 李 中 的 4 值 的 标准 差 ， 前 面 已 经 做 过 
光一 人 这 一 类 型 的 计 凌 . 
n-1 
让 我 们 试 着 求 出 音乐 会 数据 的 r 
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我 的 线条 如 何 ? 


求 音乐 会 数据 的 『 


让 我 们 用 公式 求 出 音乐 会 数据 的 r 值 。 首 先 看 一 看 数据 提示 : 


x (RNY) [9 [25 [2 [5s [7 [ss [so [2 | 





y (听众 人 数 ) |2 |33 [30 |42 [38 49 [2 55 | 


必须 知道 数值 b、5, 及 5, 才 能 利用 本 页 反面 的 公式 求 出 r。 前 面 已 经 求 出 : 


b=5.32 < 一 这 是 我 们 光 前 囊 出 的 直线 的 人 率 . 
可 是 $, 和 $, 是 多 少 呢 ? 


让 我 们 先 求 $.。 我 们 先前 求 出 Z(x- 避 ?=23.02， 且 已 知 样本 大 小 为 8。 这 
就 是 说 ， 如 果 我 们 用 23.02 除 以 7， 就 能 得 出 x 的 样本 方差 。 取 其 平方 根 
即 可 得 到 $,。 


s, = V(25.0277) 


= 1.81 {保留 两 位 小 数 ) ”此 一 


剩 下 唯一 要 求 的 就 是 sy、 前 面 已 经 求 出 了 7 = 38.875， 于 是 : 


Zly - ¥): =(22 - 38.875)? + (33 - 38.875) +(30 - 38.875)? +(42 ~- 38.875) + (38 - 38.875)? + 
(49 - 38,875)? + (42 - 38.875)? + (55 ~ 38.875)? 


= (-16.875)2 + (-5.875)? + (-8.875)? + {3.125)? + (-0.875)? + (10.125) + {3.125)2 + (16.125)? 
= 780.875 (保留 三 位 小 数 ) 


我 们 可 以 用 以 下 公式 求 出 sy， 就 是 将 Z(y - 刃 ? 除 以 n-1， 再 取 其 平方 
根 值 。 
s, = VB0.B7577) 


三 10 56 保 两 位 SS f U , J y 


现在 ,我 们 只 要 用 b、S$, 和 S, 算 出 相关 系数 r 就 行 了 。 
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计算 r 和 世上 没有 和 盆 问 题 


求 音 乐 会 数据 的 Fr ( 续 ) 


我 们 已 经 求 出 b = 532，sx = 1.81，sy = 10.56， 将 这 些 结果 用 起 


来 ， 得 出 r: 


r = bsx/sy 


= 5.32 x 1.81/10.56 
= 0.91 (保留 两 位 小 数 ) 


由 于 r 接 近 1 ， 说 明 露 天 音乐 会 听 父 人 数 和 预计 天 畏 时 数 之 
间 有 很 强 的 正 相 关 。 换 名 话说， 根据 我 们 手头 的 数据 ， 我 
们 可 以 期 望 ， 最 佳 拟 合 线 y = 15.80 + 5.32x 根 据 预计 天 畏 时 
数 给 出 了 期 望 音乐 会 听众 人 数 的 合理 的 良好 估计 。 


阅 :我 见 过 别人 用 其 他 方法 计算 f， 
他 们 错 了 吗 ? 


答 : "的 计算 公式 有 好 几 种 形式 ， 
但 这 些 形式 本 质 上 是 一 样 的 。 我 们 采 
用 的 是 最 简单 的 形式 ， 这 样 便于 看 出 
哪些 部 分 已 经 在 求 b 的 过 程 中 算 过 。 


问 ; ”这 样 小 的 一 个 样本 能 得 出 正 
确 结果 吗 ? 


我 们 用 小 样本 只 是 为 了 让 计算 过 程 
更 容易 看 懂 。 


阅 ;你 既 没有 证 明 也 没有 推导 b 
和 的 计算 公式 ， 为 什么 不 做 呢 ? 


答 ;推导 b 和 [的 计算 公式 既 歼 且 
杂 ， 本 书 决定 不 于 推导 。 关 键 是 要 
了 解 使 用 时 机 、 合 用 方法 。 
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世上 没有 俐 问题 


奖 ; 如 果 预 计 天 晴 时 数 为 0， 听 
众人 数 的 期 望 值 是 多 少 ? 


答 我 们 无 法 青 定 地 国 答 这 个 
问题 ， 因 为 这 已 经 远 远 超出 我 们 的 
数据 范围 。 对 于 在 我 们 所 拥有 的 数 
据 范 园 以 内 的 数据 ， 最 佳 拟 合 线 能 
给 出 相当 良好 的 估计 ， 但 对 于 这 个 
数据 范围 以 外 的 数据 ， 我 们 就 毫 无 
把 担 。 那 些 数据 可 能 具有 其 他 模式 ， 
因此 我 们 所 给 出 的 任何 估计 都 是 不 
可 靠 的 。 


阅 ， 前 面 讲 到 平均 数 的 时 候 ， 我 
们 曾经 看 出 单 变量 数据 可 能 出 现 异常 
值 。 那么 一 变量 数据 呢 ? 


签 : 没 错 ， 二 赤 王 数据 也 可 能 出 
现 异常 值 。 异 常 值 即 距离 回归 线 极 
远 的 那些 点 。 如 果 存 在 开 常 值 ， 则 





可 能 意味 善 你 的 数据 集中 有 异常 情 
况 ， 或 者 ， 说 明 你 的 回归 线 与 数据 
的 拟 合 程度 不 佳 。 


培 :我 曾经 听 人 说 起 过 “有 影响 
观察 结果 ， 这 是 什么 东西 ? 


签 : “有 影响 观察 结果 ”是 一 
些 在 水 平方 向 上 与 其 余 点 相距 其 远 
的 点 ， 因 此 ， 它 们 有 一 种 将 回归 线 
朝 着 它们 拉 近 的 效果 。， 


阅 :这么 说 有 影响 观察 结果 和 异 
常 值 是 一 回 事 儿 ? 


答 ; 不 对 。 弄 常 值 运 远 偏离 回 曙 
线 ， 而 有 影响 观察 结果 则 是 在 水 平 
方向 上 远 高 数据 的 点 。 
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你 力挽狂澜 ! 


你 对 音乐 会 数据 的 计算 让 音乐 会 组 织 者 大 为 惊讶 ， 现 在 他 们 可 以 
根据 天 气 预报 预测 音乐 会 听众 的 可 能 人 数 了 ， 也 就 是 说 有 办 法 让 
利润 达到 最 大 值 。 


2 
嗅 ， 老兄 ! 回归 ) 要 


\ 线 这 东西 真是 太 [车 通 了 ， 老兄 这 是 下 
站 了 ! pa 0 S ~、 一 场 演出 的 免费 入 场 玲 1 / 
和 并 En ( 


\ 
SS ) 






TS 
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加 强 练习 
加 强 詹 习 


妖怪 思 凡 达 正 在 采集 数据 -一 关于 辐射 对 阿 梅森 上 尉 的 超人 力量 产生 的 影响 。 下 面 是 辐 
射 时 间 与 阿 梅森 上 尉 能 够 举 起 的 吨 重 的 成 对 数据 。 


辐射 时 间 (分 钟 ) |3 |35 |4 |45 |5 |55 le les [7 | 





重重 (是) 4 14 12 lo Je les Js |e le | 


你 的 任务 是 用 最 小 二 乖 回 归 法 求 出 最 佳 拟 合 线 ， 然 后 求 出 相关 系数 ， 说 明 直 线 与 数据 的 关联 强度 。 请 画 出 
散 点 图 。 


如 果 思 凡 达 让 阿 梅森 上 尉 在 辐射 线 下 照射 5 分 钟 ， 你 期 望 阿 梅森 上 尉 举 起 多 重 的 重量 ? 
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我 的 线条 如 何 ? 


皆 纱 足够 . 
这” 请 尽情 地 算 吧 1! 
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加 强 练习 解答 


加 强 甸 习 
解 管 





妖怪 思 凡 达 正 在 采集 数据 -一 关于 辐射 对 阿 梅森 上 尉 的 超人 力量 产生 的 影响 。 下 面 是 辐 
射 时 间 与 阿 梅 森 上 尉 能 够 举 起 的 吨 重 的 成 对 数据 。 


辐射 时 间 (分 钟 ) |3 |35 |4 |45 |s |ss [|e |es [7 | 
(mw) | lliolsa lossla Je la 


你 的 任务 是 用 最 小 二 乘 回归 法 求 出 最 佳 拟 合 线 ， 然 后 求 出 相关 系数 ， 说 明 直 线 与 数据 的 关联 强度 。 请 画 出 
散 点 图 。 


如 果 思 凡 达 让 阿 梅 森 上 尉 在 辐射 线 下 照射 5 分 钟 ， 你 期 望 阿 梅林 上尉 举 起 多 重 的 重量 ? 


让 我 们 用 x 总 示 镍 射 时 则 ， 用 UJ 表示 举 起 网 吨 重 。 我 们 需要 事 中 回 娄 线 yj = 4 二 风 ， 因 此 让 我 们 先 求 K 和 吉 . 
X= (4+45+5+5.5+6+6.5+7)/7 
= 38.5/7 
=5.5 
y= (12+10+8+9.5+8+9+6)/7 
= 62.5/7 
二 8.9 (保留 两 位 小 数 ) 
接着 ， 让 我 们 计算 工作 -为 亿 - 基 、 王 区 -万 ?及 b。 
Ek-DY-H) = (4-5.5)(12-8.9) + (4.5-5.5) (10-8.9) + (5-5.5) (8-8.9) + (5.5~5.5) (9,5~8.9) 十 
(6-5.5) (8-8.9) + (6.5-5.5) (9~8.9) + (7-5.5) (6-8.9) 
= -1.5) 3.7) + CD + {0.5)(-0.9) + (0) (0.6) + (0.5) (~0.9) + (1) (0.1) + (1.5)(-2.9) 
一 -4.65~11 十 0.45 十 0-045 十 0.1-4.35 
一 -10 
了 区 -网 := (4-5.5): + (4.5-5.5)* + (5-5.5)? + (5.5-5.5): + (6~5.5): + (6.5-5.5)* 十 【7-5.5): 
= (-1.5)2 + (-1)? 十 (-0.5)z 十 O07 十 0.52 十 17 十 1.52 
一 2.25 十 1 十 0.25 十 0 十 0.25 十 了 十 2.25 
一 7 
Z -及 人 划 - 荡 
Ex — 2X) 
= -10/7 


二 -1.43 (你 留 两 位 小 数 ) 
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我 的 线条 如 位 ? 




















求 出 b 后 ， 即 可 用 5b 书 q。 
qa 一 雪 - 妈 
= 8.9+ 1.43 xk5,5 
= 8.9+7.86 


= 16.76 
于 是 得 出 最 住 拟 合 线 为 虽 = 16.76 -1.43X。 
相关 系数 r 的 计算 式 罗 rr = bswsby 其 中 sx 和 sb 为 变量 X 和 变量 虽 的 标准 差 。 在 形 出 bb 以后， 还 需要 囊 sx 和 sb。 


Z 雪 - 如 = (12-8.9)7 十 (10-8.9)z 十 (8-8.9)? 十 (9.5-8.9)}2 十 《8-8.9)2 + (9-8.9)’ + {6-8.9)? 
= 3.12+ 1.1*:+ (-0.9): + 0.6: + (-0.9)7 十 0.12 + (~-2.9)7 
= 9.61 + 1.21 + 0.81 + 0.36 + 0.81 + 0.01 + 8.41 


= 21,22 
z (y -yy): 
Spy g 20 
ww-i 
=¥21.77/6 各 
重 y= 16.76 ~ 1.43k 
综合 以 上 得 ， r = -0.81 
| bew/sy > 


= —1.43 x 1.08/1.9 
二 -0.81 (保留 册 位 小数} 
如 果 x=5， 由， 
Y= 16.76 ~ 1.43x 





2 4 6 8 10 


= 16.76-1.43x5 因 射 时 间 (分 钟 ) Xx 


二 9.67 


这 就 是 说 ， 在 码 射 线 下 赂 射 5 今 钟 后 





， 我 们 期 蛙 阿 标 森 上 而 能 却 举 起 9.61 吨 重音 。 
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要 点 


单 变量 数据 仅 涉及 一 个 变量 ， 二 变量 
数据 涉及 两 个 变量 。 


散 点 图 显示 出 二 变量 数据 的 模式 。 


相关 性 是 变量 之 间 的 数学 关系 ， 但 并 
不 意味 着 一 个 变量 一 定 与 另 一 个 变量 
相关 。 线 性 相关 即 两 变量 间 为 直线 的 
相关 关系 。 


正 线性 相关 即 x 的 低 端 值 对 应 于 y 的 低 
端 值 ，x 的 高 端 值 对 应 于 y 的 高 端 值 ; 
负 线 性 相关 即 x 的 低 端 值 对 应 于 y 的 高 
端 值 ，x 的 高 端 值 对 应 于 y 的 低 端 值 。 
如 果 x 和 y 的 数值 分 布 表现 出 随机 模 
式 ， 则 它们 不 存在 相关 性 。 


与 数据 点 拟 合 程度 最 高 的 线 称 为 最 佳 
拟 合 线 。 

线性 回归 法 是 一 种 求 最 佳 拟 合 线 

y = a + bx 的 数学 方法 。 
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误差 平方 和 55E 的 计算 式 为 ， 工 (y-Y)。 


直线 y = a + bx 的 斜率 b 的 计算 式 为 : 
ba -OY) 
zx- 


a 的 计算 式 为 : 
a=y- bx 

相关 系数 r 是 介 于 -1 和 1 之 间 的 一 个 
数 ， 描 述 的 是 数据 与 最 佳 拟 合 线 的 偏 
离 距离 。 如 果 r = -1， 则 为 完全 负 线 性 
相关 ; 如 果 r = 1， 则 为 完全 正 线 性 相 
关 ; 如 果 r=0， 则 不 存在 相关 性 。r 的 
计算 式 为 : 


b sx 


Sy 


r 





再 见 ……:. 





统计 孝感 谢 您 的 光临 ! 


离别 让 人 黯然 神伤 ， 不 过 ， 看 到 你 能 学 以 致 用 ， 我 们 真是 再 高 兴 不 过 了 。 后 文 尚 留 
有 不 少 遗 珠 散 玉 等 你 拾取 一 一 些 方便 实用 的 概率 表 、 一 份 需要 通读 的 索引 ， 此 后 ， 
就 该 把 所 有 这 些 新 学 问 付 诸 实践 了 。 我 们 渴望 知道 你 的 消息 ， 所 以 请 到 Head First 
图 书馆 网 站 ( www.headfirstlabs.com ) 给 我 们 写 几 句 吧 ， 让 我 们 知道 统计 学 为 你 
做 出 的 贡献 ! 
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+ 正文 未 及 的 十 大 拓展 * 





正文 既 已 ， 余 兴 未 尽 。 

我 们 觉得 还 有 一 些 内 容 是 你 需要 知道 的 ， 对 这 些 内 容 只 字 不 提 妨 有 不 慨 ， 不 过 ,其 
实 也 只 需要 简单 地 提 一 提 一 一 我 们 诚挚 地 希望 为 你 呈 上 一 本 厚薄 适度 的 书 ， 免 得 你 
为 了 捧 起 这 本 书 学 习 还 得 先 去 健身 中 心 练 练 臂 力 。 因 此 ， 请 先 通读 一 遍 这 里 的 知识 
点 ， 再 合 上 本 书 。 
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点 图 积 莹 叶 图 


#1, 数据 的 其 他 表现 形式 


我 们 在 第 一 章 讲 过 几 种 图 形 ， 这 里 再 介绍 两 种 有 可 能 用 到 的 图 形 。 


点 图 


点 图 在 图 上 以 点 表示 各 个 数值 ， 各 个 点 在 横 轴 上 的 相应 数值 上 方 堆 登 


成 柱状 ， 如 下 所 未 : 


查 个 丰 末世 -一 
个 点 ， 你 将 这 


上 ， 


3 的 数 重 一 
形成 栓 状 ， 全 一 2。 


i 


由 果 息 定量 数据 ， 册 通过 点 图 可 在 出 
数据 葡 形 状 ， 





葵 叶 用 


基 叶 图 用 于 体现 定量 数据 ， 通 常 在 数据 集 非常 小 的 时 候 使 用 。 荃 叶 图 显 
示 出 数据 集中 的 每 一 个 确切 值 ， 通 过 它 能 够 轻易 看 出 数据 的 形状 。 举 例 


如 下 : 
27 


态 突 和 公 
Fr 
二 党 电 
在 作 咏 
起 写 号 
加 号 久 
名 代号 


中 
45 


名 基 央 关 
匀 语 从 己 
久 立 空 忆 
名义 访 咏 
SRS 


这 是 你 轰 原 贻 数 据 ， 


左边 的 数值 称 为 东 ， 右 边 的 数值 称 为 叶 ， 在 上 面 的 葵 叶 图 中 ， 芭 代表 十 
位 ， 叶 代表 个 位 。 计 算 原 始 数据 中 的 每 个 数值 时 ， 用 每 一 片 叶 加 上 这 片 


叶 的 茎 即 可 。 例 如 这 一 行 ， 


10167 


60 


这 是 根据 数据 画 出 

0 解 图 密 钥 : 10 16 = 16 
000158 
0122334559 
01122344567789 
23345667899 
67 人 

芭 叶 图 蝎 计 箭 与 真 方 图 相似 ， 

但 方向 题 倒 了 一 下 ， 


它 代表 两 个 数字 : 16 和 17。16 等 于 叶 6 加 上 茎 10; 类 似 地 ，17 等 于 叶 7 加 


上 葵 10。 


通常 会 给 出 一 个 解 图 密 钥 帮 你 正确 地 理解 茎 叶 图 ， 此 处 的 密 钥 为 1016 = 16。 
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正文 未 及 的 十 大 括 展 
#2, 分 布 剖 析 


有 两 条 法 则 可 以 告诉 你 ， 大 部 分 数据 落 在 概率 分 布 中 的 哪个 区 域 。 


适 册 于 正 访 分 布 的 经 验 法 出 


经 验 法 则 适用 于 符合 正 态 分 布 的 任何 数据 集 。 它 表明 : 几乎 所 有 的 数据 烛 下 六 分 布 的 各 个 
都 位 于 距离 均值 三 个 标准 差 的 范围 内 。 具 体 来 说 : 但 验 法 赐 搓 出 ， 久生 二 人 
区 城中 出 闹 多 火 比 俐 ， 


S 大 约 68% 的 数值 位 于 下 离 均 信 1 个 标准 莽 的 区 


© 


名 大 约 95% 的 数值 位 于 滤 离 均 信 2 个 标准 天 的 范 


C2 大 的 99.7% 的 数值 位 于 虑 商 均 信 3 个 标准 可 的 


o 





只 要 知道 距离 均值 多 少 个 标准 差 就 可 以 大 致 了 解 概 率 情况 。 


适 朋 于 任何 分 布 的 切 比 雪夫 定理 


还 有 一 个 类 似 的 定理 ， 它 适用 于 任意 数据 集 ， 称 为 切 比 雪夫 定理 或 场 
比 雪 夫 不 等 式 。 它 指出 ， 对 于 任何 分 布 : 


牧 。 至 少 75% 的 数值 位 于 距离 均值 2 个 标准 差 的 范围 内 。 
乔 至 少 89% 的 数值 位 于 距 商 均值 3 个 标准 问 的 范围 内 。 


乔 。 至少 94% 的 数值 位 于 距 商 均值 4 个 标准 束 的 范围 内 。 


切 比 雪夫 定理 不 如 经 验 法 则 精确 ， 因 为 只 给 出 了 最 小 百分数 ， 但 这 仍然 能 让 你 大 


致 了 解数 值 落 在 概率 分 布 中 的 哪个 区 域 。 切 比 雪 夫 定 理 的 优点 是 它 适 用 于 任何 分 
布 ， 而 经 验 法 则 只 适用 于 正 态 分 布 。 
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进行 试验 


#3. 实验 


实验 可 用 于 检验 变量 之 间 的 因果 关系 。 例 如 ， 通 过 实验 可 以 检验 不 同 剂量 的 身 克 对 
鼻 艇 患者 的 治疗 效果 。 


进行 实验 时 ， 对 自 变量 进行 控制 ， 以 便 看 出 对 因 变 量 带 来 的 影响 。 例 如 ， 你 可 能 想 





检验 不 同 剂量 的 屠 克 对 患者 夜间 打 艇 时 数 产生 的 影响 。 身 克 的 剂量 为 自 变 量 ， 打 久 
时 数 则 为 因 变量 。 


用 于 实验 的 对 象 称 为 实验 单位 ， 例 中 的 实验 单位 为 鼻 身 患者 。 


一 个 好 实验 具备 哪些 特点 ? 


设计 实验 时 要 记 住 三 个 基本 原则 : 控制 (对 照 ) 、 随 机 和 重复 。 和 抽样 一 样 ， 这 
样 做 的 主要 目的 是 让 偏 倚 达到 最 小 值 。 


你 需要 对 外 部 影响 或 自然 变异 造成 的 结果 进行 控制 。 

进行 实验 时 ， 需 要 最 小 化 那些 不 属于 试验 范围 的 影响 因素 。 为 此 ， 我 们 首先 要 建立 一 个 控制 组 一 中 
文中 更 常 叫做 对 照 组 ， 在 医学 试验 中 则 为 一 个 不 进行 治疗 或 者 仅仅 采用 自然 疗法 进行 治疗 的 中 性 组 。 
通过 将 治疗 组 的 治疗 效果 和 控制 组 ( 对 照 组 ) 的 治疗 效果 进行 比较 ， 就 能 评估 治疗 效果 。 


安慰 剂 即 为 一 种 中 性 疗法 ， 它 对 于 因 变 量 没有 影响 。 有 时 候 ， 实 验 对 象 对 中 性 疗法 的 反应 与 对 其 不 进 
行 任何 治疗 的 反应 不 一 样 ， 因 此 ， 为 一 个 组 提供 安慰 剂 是 控制 这 种 影响 结果 的 一 种 办 法 。 如 果 服 用 安 
慰 剂 的 组 并 不 知道 所 服用 的 是 安 昧 剂 ， 则 称 为 讶 法， 如果 连 提供 治疗 的 人 也 不 知道 这 是 安慰 剂 ， 则 称 
为 双 盲 法 。 


你 需要 将 对 象 随机 分 配 到 采用 不 同 疗法 的 治疗 组 中 。 
下 一 页 详细 介绍 这 一 点 。 


你 需要 重复 实验 
每 一 种 治疗 方法 都 需要 在 许多 对 象 上 进行 实验 。 鼻 身 实 验 需要 对 多 位 鼻 身 患者 应 用 治疗 方法 ， 而 不 是 
只 对 一 位 患者 进行 治疗 ， 这样 才 能 评估 治疗 效果 。 


另 一 个 要 注意 的 问题 是 混杂 因素 。 当 一 个 实验 的 控制 方法 无 法 消除 有 可 能 对 因 变 
量 造成 影响 的 其 他 原因 ， 实 验 就 存在 混杂 因素 。 例 如 ， 假 设 你 给 男性 服用 艇 克 ， 
给 女性 服用 安慰 剂 ， 当 对 这 两 个 组 的 治疗 结果 进行 比较 时 ， 就 无 法 判断 男性 的 治 
疗效 果 是 由 于 药物 而 产生 ， 还 是 由 于 男女 两 性 的 鼻 身 问题 天 生 就 存在 差异 。 
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前 面 讲 过 ， 需 要 将 实验 对 象 随机 分 配 到 不 同 的 实验 组 中 。 但 如 何 分 组 最 为 妥当 ? 


完全 随机 从 设计 

完全 随机 化 设计 是 一 种 可 以 选用 的 方法 。 使 用 这 种 方法 时 ， 
你 将 治疗 方法 完全 随机 地 分 配给 实验 对 象 。 如 果 我 们 打算 做 
一 个 实验 检验 不 同 剂 量 的 射 克 对 患者 的 治疗 效果 ， 我 们 会 随 
机 地 把 鼻 碳 患者 分 配给 特定 的 治疗 组 。 例 如 ， 我 们 会 让 一 半 
的 患者 服用 安慰 剂 ， 另 一 半 患 者 则 服用 身 克 。 


完全 随机 化 设计 与 简单 随机 抽样 很 相似 。 不 同 的 是 ， 这 里 不 
是 随机 选择 一 个 样本 ， 而 是 随机 分 配 治疗 方法 。 


哺 机 化 区 组 设计 


另 一 个 可 以 选用 的 方法 随机 化 区 组 设计 。 这 种 方法 将 对 象 
划分 为 多 个 相似 的 组 ， 或 者 叫做 块 ， 例 如 ， 你 可 以 将 鼻 刷 
患者 分 为 男性 组 和 女性 组 ， 再 在 每 一 个 组 内 部 随机 分 配 治疗 
方法 一 对 于 每 一 个 性 别 组 ， 可 以 给 其 中 一 半 上 患者 服用 舌 克 ， 
给 另 一 半 患 者 服用 安慰 剂 。 这 样 做 可 以 减 小 性 别 因素 的 影响 ， 
从 而 达到 减 小 混杂 因素 的 目的 。 


随机 化 区 组 设计 与 分 层 随机 抽样 十 分 相似 。 不 同 的 是 ， 这 里 
是 将 对 象 分 为 几 个 组 ， 而 不 是 将 总 体 分 为 几 个 层 。 


和 配对 设计 


配对 设计 是 随机 化 区 组 设计 的 一 个 特例 ， 在 只 有 两 种 治疗 情 
况且 可 以 将 对 象 分 为 相似 的 对 子 时 可 以 使 用 这 种 设计 方法 。 
例如 ， 碳 克 实 验 可 以 有 两 种 治疗 情况 一 服用 安慰 剂 或 服用 
射 克 ， 而 患者 可 以 按照 年 龄 和 性 别 划 分 为 相似 的 对 子 。 然 后 ， 
你 让 对 子 中 的 一 位 服用 安 昧 剂 ， 另 一 位 服用 鼻 身 。 例 如 ， 如 
果 一 个 对 子 由 商 名 30 岁 的 男性 组 成 ， 称 就 可 以 让 其 中 一 名 服 
用 安慰 剂 ,， 让 另 外 一 名 服用 天 克 。 


安 出 剂 | 革 克 
sm |sw 


区 
如 果 有 1 ,000 个 对 家 ， 我 们 
可 以 社 一 从 人 服用 安奈 剂 ， 
另 一 举人 服用 艇 克 ， 


如 累 有 500 名 男性 和 500 名 女性 ， 
我 们 会 给 篆 种 性 别 的 一 学 人 服 
用 安 贷 证 ， 另 一 举人 服用 厢 克 ， 





根据 年 夫 和 伍 别 进 交 下 对 记 可 .ii 2 
这 两 种 因素 产生 哆 混 订 因素， 
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最 小 二 柔 回归 法 的 其 他 公式 


#4, 最 小 二 和 聚 回归 法 的 其 他 公式 


在 第 15 章 中 讲 过 如 何 求 最 小 二 乘 回归 线 的 公式 y = a + bx， 其 中 : 


¥ y=a 
这 是 回归 线 的 斜率 公关 ， 
Z(x - x}(y - ¥) 
b=— 
Z(x - x)? 
加 
这 个 公式 还 有 一 种 表示 方法 -一 通过 方差 来 表示 ， 许 多 人 觉得 这 种 
方法 更 便于 记忆 。 如 果 ， - 
，_ E(x - x) ， E(y - 列 : E(x - x)(y - 尺 
Sx 三 一 一 FSy = 一 一 一 一 Sm = 一 -一 一 一 
一 人 n-1 mn-1 
数值 x 抬 样 林 数 全 J 的 样本 
方 用 广 老 


则 回归 线 斜率 的 公式 可 以 另行 表示 为 ; 
同一 个 计算 藉以 不 同方 
Sxy 人 ”XX 进 行 表示 ， 
Sx2 





类 似 地 ， 可 以 改写 相关 系数 的 表示 方法 ， 将 诛 来 的 相关 系数 计算 式 ， 


b sx 
r= 





改写 为 ; 





: 5 

这 是 相关 末 数 ee 
人 本 

操 公 袜 。 SxSy 


sxy 称 为 协 方 差 ， 正 如 x 的 方差 描述 x 的 变异 人 情况 ，y 的 方差 撒 述 y 的 变异 情 
况 ，x 和 y 的 协 方差 量度 的 是 x 和 y 的 总 变异 情况 。 
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#59, 决定 系数 


决定 系数 以 r' 或 R* 表 示 ， 它 是 可 以 用 x 变量 进行 解释 的 y 变 量 的 变异 百分数 。 
例如 ， 可 以 用 决定 系数 指出 露天 音乐 会 的 听众 人 数 中 有 多 大 比例 的 变异 可 
以 由 预计 天 晴 时 数 进行 解释 。 


这 指 风 音 千 会 听信 人 数 中 有 百 今 
之 凡 的 赤 异 可 以 由 预计 天 团 时 数 


进行 航 芋 ， 





0 1 2 


3 4 5 6 

天 随时 数 (小 时 ) x 
如 果 r2 = 0， 则 无 法 从 x 值 预测 y 值 。 

如 果 蕊 =1， 则 可 以 从 x 值 预测 y 值 ， 且 无 误差 。 


通常 2 介 于 这 两 个 极 值 之 间 ，r? 越 接近 1， 越 能 通过 x 预测 y; 越 接近 0， 忆 越 
无 法 预测 y。 


计算 哇 
有 两 种 计算 r? 的 方法 。 第 一 种 只 需要 取 相 关系 数 r 的 平方 。 





2 
这 只 是 相关 系数 哆 平方 ， S 
s,s, 


另 一 种 方法 是 将 各 个 y 值 与 其 估计 值 的 差距 取 平 方 ， 然 后 求 和 ， 再 除 以 y 值 
与 了 的 差距 的 平方 的 总 和 。 


£ Dd y)? 料 j 
一 一 ” A 又 . 
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#6. 非 线性 关系 


当 两 个 变量 存在 关系 时 ， 这 种 关系 不 一 定 是 线性 的 。 下 面 是 一 些 散 点 图 实例 ， 
其 中 x 和 y 有 清晰 的 数学 关系 ， 但 这 种 关系 并 不 是 线性 关系 。 


二 模式， 但 由 于 和 不 是 
入 后 模 ， 图 北 壮 疾 线 人 


义 义 
xx** 





线性 回归 法 假设 两 个 变量 之 间 的 关系 可 以 通过 直线 描述 ， 因 此 对 于 这 样 的 原 
始 数据 ， 运 用 最 小 二 乘 回归 法 无 法 很 好 地 估计 回归 线 的 方程 。 


不 过 ， 有 一 个 办 法 可 以 解决 这 个 问题 。 有 时 候 可 以 通过 对 x 和 y 进 行 转化 ,使 


结果 接近 线性 。 然 后 可 以 对 转化 结果 运用 线性 回归 法 ， 求 出 a 和 b。 最 大 的 困 如 果 最 佳 拟 合 线 为 
难 在 于 努力 将 图 形 的 非 线性 方程 转化 为 以 下 形式 : 非 线性 形式 有 时 
w. Ld 
bs 候 可 以 通过 转换 使 
其 中 y 和 x 为 x 的 函数 。 其 成 为 线性 形式 。 
例如 ， 你 求 得 的 最 佳 拟 合 线 可 能 具有 下 列 形 式 ; 
y= 1Aa + bx) 
这 可 以 变形 为 : 合 由 二 9 + tx 的 酌 式 了 ， 


闹 在 
liy=a+bx K” 于 征 可 以 使 用 线性 回归 法 ， 


这 里 讲 得 很 入 略 ， 只 是 为 了 


于 是 y = 1/y， 这 就 是 说 ， 你 可 以 对 直线 y' = a + bx 运用 最 小 二 乘 回归 法 ， 其 中 pe 汪 全 知道 可 能 的 做 信 
让 从 


y = ly。 完 成 y 值 的 转化 后 ， 就 可 以 使 用 最 小 二 乘 回 好 法 求 出 a 和 b 的 数值 ， 然 
后 再 将 结果 代 人 原始 方程 。 
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#7, 问 归 线 斜 率 的 置信 区 问 


前 面 的 章节 中 已 经 讲 过 如 何 求 得 和 o? 的 置信 区 间 ， 对 于 回归 线 
y=a+bx， 还 可 以 求 出 其 斜率 的 置信 区 间 。 





b 的 置信 区 间 如 下 : 
b + (误差 范围) 
可 是 误差 范围 是 多 少 呢 ? 
b 的 误差 范围 
误差 范围 计算 如 下 : 
误差 范围 = t( v ) x (b 的 标准 差 ) 
其 中 v=n-2，n 为 样本 的 观察 结果 数目 。 为 了 求 出 t(v ) 的 数值 ， 可 用 t 
分 布 概率 表 查 找 v 和 置信 水 平 。 
b 的 抽样 分 布 的 标准 差 计算 如 下 .4 
一 参加 统计 学 考试 时 
入 by i 
这 是 b 的 扫 样 入市 | 到- are 
i Ss = 也 就 是 说 你 不 用 记 住 这 个 公 
” VE(x - xX)? : 


式 ， 只 要 会 用 就 行 了 。 


计算 过 程 是 ， 用 y 的 观察 值 减 去 从 回归 线 得 出 的 y 的 估计 值 ， 所 
得 的 差 进 行 平 方 ， 将 所 有 的 平方 数 加 起 来 ; 然后 除 以 n-2; 取 平 
方 根 ; 再 用 所 得 结果 除 以 x 的 观察 值 与 x 之 差 的 平方 之 和 。 


于 是 得 出 置信 区 间 为 : 全 合用 后 是 t 今 布 ， 自 由 度 怕 
w—2 
A g 
(b - t(v) sb b + t(v) sb) v=n-2 


求 出 b 的 标准 差 还 有 别 的 用 处 。 例 如 ， 还 可 以 用 于 假设 检验 ， 检 
验 一 条 回归 线 的 斜率 是 否 具有 特定 值 。 
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#8, 抽样 分 布 一 两 个 均值 之 闽 的 着 异 


有 时 候 ， 知 道 抽 样 分 布 的 情况 对 于 了 解 两 个 正 态 分 布 总 体 的 均值 之 差 十 分 有 用 ， 
你 可 能 想 用 这 个 差 值 构建 一 个 置信 区 间或 进行 一 个 假设 检验 。 例 如 ， 你 可 能 想 
基于 “两 个 正 态 分 布 的 总 体 的 均值 相等 ”这 一 假设 进行 一 个 假设 检验 。 


如 果 X~N(kh ve, Y~ N(py, cy )， 其 中 X 和 Y 相 互 独立 ， 则 X - Y 的 分 布 的 
期 望 和 方差 的 计算 式 为 : 


二 元 这 是 图 为 EX -站 ) = EY) -EC(f) 






ox oy 类 似 地 ， Var(x - Y) = Var (X) + var(y) 
Var(X -可 = 一 + 一 


ny 


通过 上 式 可 以 求 出 X - Y 的 置信 区 间 。 置 信 区 间 公 式 为 (统计 量 ) + (误差 范围 )， 
因此 在 本 例 中 ， 置 信 区 间 为 : 


< 值 取 决 于 置信 区 间 所 要 求 的 置信 水 平 : 





如 果 ox? 和 oy? 未 知 ， 则 需要 用 s2 和 s 2 进行 近似 。 如 果 样本 很 大 ， 则 仍然 可 
以 使 用 正 态 分 布 。 如 果 样本 很 小 ， 则 需要 使 用 t 分 布 。 
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#9. 抽样 分 布 一 两 个 比例 之 癌 的 部 异 


还 有 一 个 针对 两 个 二 项 分 布 总 体 的 比例 差异 的 抽样 分 布 ， 利 用 这 个 分 布 可 以 
构建 一 个 置信 区 间或 进行 一 个 假设 检验 。 例 如 ， 你 可 能 想 基于 “两 个 总 体 比 
例 相 等 ”这 一 假设 进行 一 个 假设 检验 。 


如 果 X ~ B(n p,)，Y ~ Bln,, p,)， 其 中 X 和 Y 相 互 独立 ， 则 分 布 pv - P, 的 期 
望 和 方差 为 : 


像 前 面 一 样 . E(Pz -Pd) = EPx) - EPy) 


pq Pyqdye- "PT-? = Var(ps) + Var(py) 
nx ny 











如 果 每 个 总 体 的 np 和 nq 都 大 于 5， 则 PA- P, 可 以 近似 于 正 态 分 布 。 即 : 


Pp.q. p,q 
p.-Pp,~N(P.- pres ob) 


Xx my 


通过 这 个 分 布 可 以 求 出 P。 - P, 的 置信 区 间 。 置 信 区 间 等 于 (统计 量 ) + (误差 
范围 )， 因 此 ， 在 本 例 中 ， 置 信 区 间 为 : 


这 是 Px- Py 网 政信 区 网 
p. ~ p, 土 cVVar(P. - P) 《一 


< 值 取 决 于 置信 区 间 所 要 求 的 蚌 信 水 平 ，< 值 与 下 一 页 的 结果 相同 。 


1 
的 抽样 分 布 ， 是 会 给 出 抽样 分 布 的 方差 的 。 


也 就 是 说 你 不 用 记 住 这 个 公式 ， 只 要 会 用 就 行 了 。 
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#10, 连续 概率 分 布 的 EX 和 Var(X) 
在 求 离散 概率 分 布 的 期 望 和 方差 时 ， 我 们 使 用 下 列 算式 : 
E(X) = ZxP(X = x) 


Var{X) = Zx2pP(X = x) - EZ2(X) 


在 概率 分 布 为 连续 分 布 的 时 候 ， 则 通过 面积 求 期 望 和 方差 。 
例如 ,假如 你 有 一 个 连续 概率 分 布 ， 其 概率 密度 函数 如 下 : 


f(x) = 0.05 0sxs20 


这 是 报 童 竹 度 西数 f(O 的 图 禾 、 
Tq 


这 殊 种 的 均匀 分 市 ， 
因为 fUO 是 一 个 常数。 


求 E(X) 


为 了 求 出 期 望 ， 我 们 需要 求 出 概率 分 布 范围 内 的 曲线 xf(x) 下 方 的 面积 。 实 例 
中 要 求 的 是 x 在 0 至 20 范 围 内 的 图 形 0.05x 下 方 的 面积 。 





xf(x) 





这 块 面 积 即 为 E09 
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求 Var(X) 个 连续 随机 变量 的 期 

a 望 和 方差 。 

为 了 求 出 方差 ， 需 要 求 出 曲线 x2f(x) 下 方 的 面积 ， 然 后 减 去 EX(X)， 即 , 要  : 你 经 常用 到 的 是 正 态 分 布 之 

求 出 曲线 0.05x? 下 方 介 于 0 和 20 之 间 的 面积 ， 然 后 减 去 E(X) 的 平方 。 类 ， 若是 这 种 情况 ,期望 和 方 
: 差 都 会 被 给 出 。 


x2f(x)} 






20 z 
为 了 囊 出 Yar09 ， 我 们 营 出 这 块 面 


aa 外 后 减 去 刀 00 ， 





0 20 x 


通常 ， 在 整个 x 范围 内 ， 连 续 随机 变量 的 期 望 和 方差 计算 如 下 : 


需 虹 
E(X) = jxf(x)dx 未 这 竺 入 机 量 的 良 电 和 方才 
到 皱 积 分 ， 


Var(X) = pes)dx - EXY 
/市 场 营销 部 撒 话 ， 能 给 《省 入 浅 出 微 
积分 8》 做 个 广告 吗 - 很 快 就 出 版 .1 


重要 统计 量 
罗 科 分 穴 
避 果 X 符 合 声名 分 布 ， 则 : 
f= 1/(0-q) 其 中 a<x<b 
EX%) = (a + b}/2 
varC) = (oo - a)12 附录 | 访 坎 Bs 


附录 1 由， 统计 表 


这 下 载 知 道 素 德 到 
底 怎 么 查 到 的 了 . 





缺少 值得 信赖 的 概率 表 该 怎么 办 ? 
仅仅 了 解 概 率 分 布 是 不 够 的 ， 有 时 还 需要 在 标准 概率 表 中 查找 概率 。 这 份 附录 给 出 
了 正 态 分 布 、t 分 布 和 X? 分 布 的 概率 表 ， 可 在 其 中 尽情 查找 各 种 概率 。 
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#1, 标准 正 态 分 布 表 


出 


> 4 


为 了 5 


通过 本 表 可 求 P(Z < z) 的 概率 ， 其 中 Z ~ N(0, 1)。 


P(Z < z)， 可 查 精确 到 2 位 小 数 的 z 值 ， 然 后 读 出 概率 即 可 。 


.… 狼 后 从 表 中 该 出 概率 ， 


je 


和 和 








alll 
a 
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快 来 查 表 


#1, 标准 正 态 分 布 表 ( 续 ) 


这 些 是 z 为 正 数 时 P( 乙 < z) 
的 概率 , 





NN 


| 


CT ZT EZ ET zz EE 
ey | 7500 [70m | ze | 767s | 770¢ 
os | 7o0 [700 | zw | zz | 7955 | 
es | ms | oe | ema | se | wo 二 


.848: .8508 


| 


wm YIN|: S 人 这 


二 


© 
人 


| | ee | 
a | 0 | ms | se | m0 | sm | 0 | me | 
a | oo0r | se04 | 068 | 907 | 9075 | oo7s | 
a | oo | 0% | 9 | 950 | wo | we 


| 9945 _ 
a | 9%53 | 9%55 | 9%50 | 9957 | 9059 | o60 | 
7 | | ww | 507 | 90%8 | 9969 | so70 | 557 | 
ET ZH EZ EZ EZ A EZ ZE 
E29 | re | sez | sez | se | 9984 | so84 | 
ER ER EA ET EN EE 
| 9991 | 9991 | 9001 | 





| 8997 | 9015 | 
| 9162 | 9177 

| 9306 | 9319 | 
| 9429 | 9441 | 
| 9535 | 9545 | 
E 理想 - 
| 9699 | 9706 | 
更 二 通 相 > 滑 
EE | 
| 9913 | 996 | 
| 9934 | 9936 | 
| 9951 | 9952 | 
| 
| 9993 | 9993 | 
| 9995 | 9995 | 
| 9996 | 9997 | 
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{分 布 表 六 





#2, 分布 临界 值 f 
本 表 可 查 出 P(T > t) = p 时 的 t 值 。T 符 合 t 分 布 ，v 为 自由 度 。 查 找 v 值 和 p 值 ， . % 江汉 此 
然后 读 出 t。 3 个 / 
2 eS ee 
t 


7.453 12.92 


1.415 5.408 然后 从 表 中 读 出 t 的 值 


EE 


于 :区 

az | [au 

em re im 
39%0 


EE 


有 
me | om0 | ss | on | 13 | 176 zs | a6 | 4 
| 07 | es [ro [ss | 70 [ee 上 
| ee | oz | az [za 


ie | 0 | ee row | ram | im | 2 


2.042 


2.639 


人 


D 
© 
所 
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快 来 查 表 


#3. 多 临界 值 


本 表 可 查 出 P(X > x) = a 时 的 X 值 。X 符 合 x? 分 布 ， 自 由 
度 为 v 。 查 找 v 和 a 的 值 ， 即 可 读 出 x 





在 第 一 列 查找 v 的 值 …… …-… 在 第 一 行 查找 


Ee 
本 电导 
必 二 池 
7 > 2 钛 后 从 表 中 
Er 
RE TN 
| | | 
TT Tea 
sm om om [wo | mw [me 50] 


| 21.06 _ 
[| [wm | 0 | wn | 20 | 2 [az 
| wr az | mn | mo xm | wes se 
| | 2049 | 216 | 2298 | 


RE 
a ED 

| zw | xp | 

| ze | 

mn | rl| ms | | 0 | ss7 | 0 | m7 | me | er 


| 24 | 2824 | 255 | 3113 | 3320 | 3642 | 3936 | 4027 | 4298 | 4556 | 
| wa | we | wm | wm | 6s | wes | a | sm | som 


wm | [sme [os | sr | om [ne | nn | | no | 6 

nm [nm | nn [nm | ew | um [mm ns 
[os [ee [as | mos | i 
save oz 
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符号 


| 符号 ( 参见 条 件 概率 ) 
六 交集 
求解 159 
PIANMB)S PA|B} 165 
P{ 黑 门 惕 ) 167 
Pt 偶 ) 167 
1ipP， 期 望 281 
入 
大 的 时 候 407 
小 的 时 候 407 
入 分布 ( 参见 泊 松 分 布 】 
h( 细 ) 50, 445 
confidence intervals { 置信 区 间 ) 498 
v{ 纽 ) 573 
degrees of freedom ( 自由 度 ) 574 
{西格玛 】 49 
mean (均值 ) 49 
{西格玛 】 107 
和 2 ( 卡 方 ) 576 
xX? ( 卡 方 ] 分 布 567-604 
cheat sheet ( 小 抄 ) 584 
contingency table ( 列 联 表 ) 587 
defined { 定义 】 572 
degrees of freedom ( 自由 度 ) 574, 576, 595 
calculating 591 ( 计算 ) 
generalizing { 归纳 ) 596-597 
expected frequencies ( 期 望 频数 ) 587-588 
goodness of fit ( 拟 合 优 度 ) 573, 579, 584 
independence ( 独立 性 ) 573, 586 
main uses { 主要 用 途 ) 573 
Significance ( 显著 性 ) 575 
v( 纽 ) 573 
x? ( 卡 方 ) 假设 检验 步骤 576 
xX? ( 卡 方 ) 概率 表 575 
好 ( 卡 方 ) 检验 571 


六 
索 别 + 


X{x 撤 ) 445-447, 472-476 
distribution of (分布 】 476-486 


A 


accurate linear corretation { 精确 线性 相关 】 630 
alternate hypothesis ( 备 择 恨 设 ) 529-530, 543 
average { 平均 值 ) 46-82 

mean { 均值 ， 参 见 “mean” ) 

median { 中 位 数 ， 参 见 “median” } 

mode { 众 数 ， 参 见 "mode " } 

types of ( 类 型 …… ) 71 
average distance { 平均 距离 ) 105 

interquartile range ( 四 分 位 距 ) 105 


b 


bar charts { 条 形 图 ) 10-20, 23 
frequency scales ( 频数 刻度 ) 13 
percentage scales ( 百分数 刻度 ) 12 
scales ( 刻度】 23 
segmented bar chart ( 分 段 条 形 图 ) 14 
split-category bar chart { 分 立 条 形 图 } 14 
Bayes” Theorem { 贝 叶 斯 定理 ) 173, 178-179 
bias ( 偏 倚 ) 423-426, 434, 438 
in sampling { 抽样 …… ) 424-426, 438 
sources (来 源 】 425 
bimodal ( 双 峰 】 73 
binomial distribution ( 二 项 分 布 ) 289, 324, 384,， 
392-393, 544 
approximating ( 近似 ) 389, 398, 407 
approximating with normal distribution ( 近似 正 态 分 
布 } 386 
approximating with Poisson distribution ( 近似 泊 松 分 
布 ) 316-317 
central limit theorem ( 中 心 极限 定理 ) 482 
binorniat distribution {continued) ( 二 项 分 布 ( 续 ) ) 
discrete { 离散 ) 395 
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expectation and variance ( 期 望 与 方差 ) 298, 301 
finding mean and variance { 求 均 值 与 方差 ) 389 
guide { 指南 ) 302 
Versus normal distribution ( .…… 与 正 态 分 布 ) 393, 395 
Binomial Distribution Up Close ( 二 项 分 布 细 细 看) 297 
binomial probabilities ( 二 项 分 布 概率 ) 384 
bivariate data { 二 变量 数据 ) 608, 616, 640 
visualizing ( 图 形 化 】 609 


blinding ( 言 法 ) 646 
box and whisker diagrams ( 箱 线 图 】 100-102 
box plot ( 箱 形 图 } 100 
Bullet Points ( 要 点 ) 
bias { 偏 丛 ) 438 
binomial distnibution ( 二 项 分 布 】 324 
bivariate data ( 二 变量 数据 ) 640 


box and whisker diagram { 箱 线 图 ) 102 
cluster sampling { 整 群 抽样 ) 438 
continuity correction ( 连续 性 修正 ) 396 
continuous data ( 连续 数据 ) 337 
continuous probability distributions ( 连续 概率 分 布 ) 337 
correlation coetficient ( 相关 系数 ) 640 
critical region ( 拒绝 域 ) 539 
cumulative frequency ( 累积 频数 ) 42 
discrete data ( 离散 数据 ) 337 
expectation and variance of X ( X 的 期 望 和 方差 ) 485 
expectation of random variable X { 随机 变量 X 的 期 望 ) 224 
expectations ( 期 望 ) 220, 233 
frequency density ( 频数 密度 ) 30 
geometric distribution ( 几何 分 布 ) 324 
histograms ( 直方 图 ) 30 
hypothesis tests ( 假设 检验 ) 539 
Type 1 error (第 一 类 错误 ) 566 
Type ll error (第 一 类 错误 ) 566 
independent observations { 独立 观察 结果 ) 378 
independent observations of X ( X 的 独立 观察 结果 ) 233 
independent random variables { 独立 随机 变量 } 233 
interpercentile range ( 百 分 位 距 ) 102 
interquartile range { 四 分 位 距 】 97 
kth percentile { 第 k 吾 分 位 数 】 102 
linear regression ( 线性 回归 ) 640 
linear transforms ( 线性 变换 】 220, 224, 233 
line of best ft ( 最 佳 拟 合 线 ) 640 
negative linear correlation { 负 线性 相关 } 640 
normal distribution ( 正 态 分 布 ) 359 
approximating ( 近似 ) 396 


664 深入 浅 出 统计 学 


normal probabilities ( 正 态 概率 ) 359 
one-tailed tests ( 单 尾 检验 ] 539 
p-value ( p 值 ) 539 
percentiles { 百 分 位 数 ) 102 
point estimator ( 点 估计 量 ] 447 
Poisson distribution ( 泊 松 分 布 】 324, 412 
population { 总 体 ) 438 
positive linear correlation ( 正 线性 相关 ) 640 
probability distributions ( 概率 分 布 ) 220, 224 
quartiles ( 四 分 位 数 】 97 
range ( 距 ) 97 
sample (样本 】 438 
sampiing distribution of means { 均值 的 抽样 分 布 】 485 
samping distribution cf proportions | 比例 的 抽样 分 布 ) 466 
scatter diagrams |( 散 点 图 ) 640 
significance level ( 显著 性 水 平 ) 539 
simple random sampling { 简单 随机 抽样 ) 438 
standard deviation ( 标准 差 ) 122, 220 

G 224 
standard error of proportion { 比例 标准 误差 ) 466 
standard error of the mean ! 均值 标准 误差 】 485 
standard scores ( 标准 分 ) 122 
stratified sampling ( 分 层 抽样 ) 438 
sum of squared errors ( 误差 平方 和 ) 
systematic sampling ( 系统 抽样 ) 438 
test statistic ( 检验 统计 量 ) 539 
two-tailed tests ( 双 尾 检验 ) 539 
univariate data { 单 变量 数据 } 640 
upper and lower bounds ( 上 界 和 下 界 } 97 
variance of random variable X ( 秆 机 变量 X 的 方差 ) 224 
variances | 方差 】 122, 220, 233 
z-scores ( z 分 ) 122 
Xx? distribution ( X2 分 布 ) 598 

goodness of fit test ( 拟 合 优 度 ) 598 

test for independence { 检验 独立 性 ) 598 

categorical data [ 类 别 数据 ) 


mean ( 均值 ) 62 

median ( 中 位 数 } 62 
categories versus numbers { 类 别 与 数字 ) 18-23 
causation versus correlation ( 因果 与 相关 ) 614 
census ( 普查 } 418 


central limit theorem { 中 心 极限 定理 】 481-482, 485 
binomiat distribution ( 二 项 分 布 ) 482 


640 


18, 73 


Poisson distribution ( 泊 松 分 布 ) 482 
central tendency ( 集中 趋势 】 45-82 


charts and graphs ( 图 表 】 4 
bar charts ( 条 形 图 ) 10-20, 23 
bar chart scales ( 条 形 图 刻度 ) 23 
choosing right one !( 做 出 正确 选择 ) 39-40 
comparing { 比较 ) 6 
cumulative frequency { 累积 频数 】 35. 42 
failure ( 遇 挫 ) 3 
frequency ( 频数】 8-9, 23 
frequency scales { 频数 刻度 】 13 
histograrns ( 直方 图 ， 和 参见 “histograms” ) 
horizontal bar charts ( 水 平 条 形 图 } 11., 23 
line charts ( 线形 图 ) 41, 42 
multiple sets of data { 多 批 数据 ) 
numerical data ( 数字 数据 } 23 
percentage sales { 百分数 刻度 】 12 
pie charts ( 饼 图 ) 8-9, 9, 23 
proportions ( 比例 ) 9 
scales ( 刻度 ) 12 
segmented bar chart ( 分 段 条 形 图 } 14 
software ( 软件 ) 6 
split-category bar chart ( 分 立 条 形 图 } 14 
vertical bar charts ( 垂直 条 形 图 ) 10-11, 23 
Chebyshev”s inequality { 切 比 雪夫 不 等 式 ) 645 
chi square {x?} ( 卡 方 (x2)】 576 
chi square {x?) distribution { 卡 方 (x 分 布 ) 567-604 
cheat sheet ( 小 抄 } 584 
contingency table ( 列 联 表 ] 587 
defined ( 定义 】 572 
degrees of freedom [ 自由 度 ) 574, 576, 595 
calculating ( 计算 ) 591 
generalizing ( 归纳 } 596-597 
expected frequencies | 期 妇 频 数 ) 587-588 
goodness of fit { 拟 合 优 度 } 573, 579, 584 
independence { 独立 性 ) 573, 586 
main uses ( 主要 用 途 ) 573 
significance ( 显著 性 ) 575 
vi( 纽 ) 573 
chi square ({x2 hypothesis testing steps ( 卡 方 (xz 假设 检验 
步骤 】 576 


chi square {x2 probability tables ( 卡 方 (x32 构 率 表 } 575 
chi square (x2 test ( 卡 方 {x”) 检 验 } 571 
clustered sampling ( 整 群 抽样 ] 434 


14, 23 


cluster sampiing ( 整 群 抽样 ] 433-434. 436, 438 
coefficient of determination ( 决定 系数 ) 649 


combinations ( 组 合 ， 参 见 “perrnutations and 
combinations” ) 


combined weigh ( 综合 体重 ) 
continuous |( 连续 ) 365 
distributed ( 分 布 ) 367 
distributed normally ( 正 态 分 布 】 365 


complementary event | 对 立 事件 ) 136 


completely randornized design {experiments}) ( 完全 随机 化 
设计 ) 647 
conditional probabilities ( 条 件 概率 ) 
Bayes' Theorem { 贝 叶 斯 定理 ) 
PIANMB}SPA|B) 165 
Pl 黑 | 偶 ) 170 
probability tree ( 概率 树 ) 158-161 
confidence intervals { 置信 区 人 各 ) 487-520, 539 
cheat sheet ( 小 抄 ) 504 
confidence level changes { 置信 水 平 改变 ) 518 
four steps for finding { 求解 置信 区 间 四 步骤 ) 491-502 
Step 1: Choose your population statistic ( 第 1 步 : 
选择 总 体 统计 量 ) 492, 508 
Step 2: Find its sampling distribution [ 第 2 步 : 求 出 
其 抽样 分 布 ) 492, 509 
Step 3: Decide on the level of confidence ( 第 3 步 : 
决定 置信 水 平 】 494, 512 
Step 4: Find the confidence limits ( 第 4 步 ， 求 出 置 
信 上 下 限 ) 496-501, 513 
introducing { 认识 置信 区 间 ) 490 
point estimators ( 点 估计 量 } 493 
selecting appropriate confidence level { 选择 合适 的 置 
信 区 间 ) 495 
size of sample changes { 改变 样本 大 小 ) 518 
confidence intervals (continuedj { 置信 区 间 ( 续 ) ) 
slope of regression line { 回归 线 斜 率 ) 651 
summary ( 总 结 ) 503 
t-distributions ( t 分 布 ) 509-515 
pfrebability tables { 概率 表 ) 513 
shortcuts ( 简明 表示 ) 515 
small sample { 小 样本 ) 510 
standard score { 标准 分 ) 511 
versus confidence level { 关于 置信 水 平 】 507 
confidence level versus confidence interval { 置信 水 平 与 
置信 区 间 ) 507 


confidence limits ( 置信 上 下 限 ) 496, 502, 513 


157-160 
173 


索引 665 


confounding !( 混杂 因 业 ) 646 

contingency table ( 列 联 表 ) 587 

continuity correction ( 连续 性 修正 ) 395-398, 412 
Continuity Corrections Up Close { 连续 性 修正 细 细 看 ) 397 
continuous data ( 连续 数据 ) 327, 337. 365 


frequency ( 频数) 328 

probability distribution ( 概率 分 布 】 329-333 
range of values { 数值 范围 ) 333 

versus discrete data { 关于 高 散 数据 ) 366 


continuous probabilities ( 连续 概 空 ) 333 


continuous probability distributions !( 连续 概率 分 布 】 337 
EX}) 和 Var{X) 654-655 

continuous random variables ( 连续 随机 变量 ) 331 

Continuous Scale versus discrete probability 


distribution ( 连续 刻度 与 离散 概率 分 布 ) 
control group ( 控制 组 ( 对 照 组 ) ) 646 
controls ( 控制 ( 对 照 ) ) 646 
correlation and regression ( 相关 与 回归 ) 605-642 
accurate linear correlation { 精确 线性 相关 ) 630 
bivariate data ( 二 变量 数据 ) 608, 616, 640 
visualizing ( 图 形 化 ) 609 
correlation coefficient ( 相关 系数 ) 
Correlation versus causation ( 相关 与 因果 ) 
dependent variable ( 因 变 量 ) 608 
explanatory variable { 解释 变量 ) 608 
independent variable ( 自 变量 】 608 
least squares regression { 最 小 二 乘 回归 ) 
linear regression ( 线性 回归 ) 626, 640 
line of best fit ( 最 佳 拟 合 线 ) 618, 624, 640 
finding equation ( 求 公 式 ) 622 
finding slope ( 求 斜率 ) 623-624 
sum of squared errors !{ 误差 平方 和 ) 620-621 
negative linear correlation { 负 线 性 相关 ) 613, 631, 640 
no correlation ( 不 相关 ) 613, 631 
no linear correlation ( 非 线 性 相关 ) 630 
outliers { 异常 值 ) 634 
perfect negative linear correlation ( 完全 负 线性 相关 ) 631 
perfect positive linear correlation { 完全 正 线性 相关 ) 631 
positive linear correlation ( 负 线性 相关 ) 613, 631, 640 
regression line ( 回归 线 ) 626 
response variable ( 反应 变量 ) 608 
scatter diagrams { 散 点 图 ) 609, 612, 616, 618, 640 
scatter plots ( 散 点 图 ) 609 
sum of squared errors { 误差 平方 和 }) 


395 


630-634, 640 
614 


626 


640 


666 深入 浅 出 统计 学 


univariate data { 单 变量 数据 } 
correlation coefficient { 相关 系数 ) 

formula ( 公式 】 632 

least Square regression { 最 小 二 乘 回 归 ) 648 
critical region { 拒绝 域 ) 531-534, 539, 548 


Critical Regions Up Close { 拒绝 域 细 细 看 ) 534 


608, 640 
631-634, 640 


critical value { 临界 值 ) 532 

cumulative frequency { 累积 频数 ) 34-38, 42 
graph (图 ) 35 

data ( 数据 ) 


categorical and numerical data ( 类 别 数据 与 数字 数据 】 18 
categorical data { 类 别 数据 】 18 
grouped ( 分 组 ) 19 
mukiple sets of data { 多 批 数据 ) 14 
numerical data { 数字 数据 】 18 
qualitative data { 定性 数据 ) 18 
deciles ( 十 分 位 数 ) 98 
degrees of freedom { 自由 度 ) 674, 576, 595 
calculating ( 计算 】 591 
generalizing { 归纳 ) 596-597 
number of ( 数量 ) 510 
dependent events { 独立 事件 ) 181, 189-190 
dependent variables (experiments) ( 因 变 量 ) 608, 646 


discrete data ( 离散 数据 ) 329, 337, 370 


versus continuous data { …… 与 连续 数据 ) 326-327， 
366 
discrete probability distributions { 离散 概率 分 布 ) 
197-240 


expectation { 期 望 ) 204-208 

linear transforms |( 线性 变换 ) 233 
expectations { 期 望 ) 219 
independent observations ( 独立 观察 结果 ) 224， 


225-226 
linear relationship between E(X} and E{Y) { E(X} 和 E({Y) 
之 间 的 线性 关系 ) 217-218 


linear transforms ( 线性 变换 ) 219, 225-226 
expectation and variance { 期 望 和 方差 】 233 
linear transforms versus playing multiple games { 线性 
变换 与 多 局 赌博 ) 221 
observation ( 观察 值 ) 222-224 
observation shortcuts ( 观察 值 速算 法 ) 223 


Pool Puzzle ( 奇妙 池 ) 215-216 
random variables { 随机 变量 ) 

adding { 增加 ) 230 

independent ( 独立 】 233 

subtracting |( 减 小 】 231 
shortcut or formuia ( 简便 算法 或 公式 ) 236 
variance { 方差 ) 205-208, 219 

linear transforms { 线性 变换 ) 233 
Versus continuous Scale ( ……: 与 连续 刻度 ) 

discrete random variables ( 离散 随机 变量 】 202 


distribution { 分 布 ) 
anatomy { 剖析 ) 
mean ( 均值 ] 56 
ofX+YI(X+Y…) 


dotplots ( 点 图 ) 644 
double blinding { 双 言 法 ) 646 
drawing lots ( 抽签 ) 431, 434 


E 


E{X) and Var(X) for continuous probability distributions ( 连 
续 概率 分 布 的 EX 和 Var(X) ) 654-655 


empirical rule for normal distribution ( 正 态 分 布 经 验 法 则 ) 


395 


645 


370 


645 
estimating populations and samples { 总 体 和 样本 的 估计 ) 
441-486 


central limit theorem ( 中 心 极限 定理 } 481-482, 485 
binomial distribution { 二 项 分 布 ) 482 
Poisson distribution { 泊 松 分 布 ) 482 
distribution of P, ( P 分布 ) 464-466 
expectation of P, { P. 的 期 望 ) 462 
formulas (公式 】 451 
point estimaters { 点 估计 量 ) 443-447, 452 
for population variance ( 总 体 方差 的 ……. ) 457 
sampling distributions { 描 祥 分 布 ) 485 
population mean ( 总 体 均值 } 443, 446 
population parameters ( 总 体 参 数 ) 444 
population proportion ( 总 体 比例 】 454-457 
population variance ( 总 体 方差 ) 448-450 
prebabilities for a sample { 样本 概率 ) 459 
proportions, sampling distribution ef ( 比例 ， 抽 样 分 布 ) 460 
sample mean ( 笠 本 均值 ) 445, 446 
sample variance ( 样本 方差 } 449, 452 
sampling distribution { 抽样 分 布 ) 466 
continuity correction ( 连续 性 修正 ) 469 
of proportions { 比例 …… } 460 


sampling distribution of means [ 均值 的 抽样 分 布 ) 
471-479 
distribution of x { X 的 分 布 ) 480 
expectation for X ( X 的 期 望 ) 474-475 
variance of X { X 的 方差 ) 476 
standard error ( 标准 误差】 485 
of mean ( 均值 …… 】 479 
of proportion { 比例 …… ) 466 
variance of Ps ( Ps 的 方差 】 463 
xbar ( x 拔 ) 445 
HH 445 
events ( 事件 ) 132 
complementary ( 对 立 】 136 
dependent ( 独立 ) 181 
exclusive { 五 斥 ) 147-154 
versus exhaustive ( 穷 举 ) 
independent ( 独立 ) 182-184 
versus dependent ( … 与 独立 ) 
intersecting ( 相交 ) 147-154 
mutually exclusive ( 互 斥 ) 147, 150 
exciusive events ( 互 乒 车 件 ) 147-154, 150 
exhaustive ( 穷 举 ) 149 
exhaustive events { 穷 举 事件 ) 150 


expectations ( 期 望 ) 204-208, 219, 220, 367 
1/p 281 
binomial distribution { 二 项 分 布 ) 298 
expectations {continued) ( 期 望 ( 续 ) ) 
geometric distribution ( 几何 分 布 ) 280-281 
independent observaticns { 独立 观察 结果 ) 378 
iineartransforms ( 线性 变换 】 233 
Peisson distribution ( 泊 松 分 布 】 308 
two games ( 两 局 赌局 ) 222-224 
experimental units ( 实验 单位 ) 646 
experiments ( 实验 ) 646 
designing ( 设计 ) 647 
explanatory variable ( 解释 变量 ) 608 


F 


factorials { 阶乘 ) 246, 248 


Fireside Chats, Dependent and Independent discuss 
their differences ( 面对面 : 相关 与 独立 差异 谈 ) 
186-187 


Five Minute Mystery ( 五 分 钟 推理 ) 


150 


189-190 
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Case of the Broken Cookies | 破碎 的 饼干 ) 
Solved ( 破解】 318 

Case of the High Sunscreen Sales ( 防晒 逢 销量 索 ) 611 
Soived ( 破解 ) 615 

Case of the Lost Coffee Sales { 
Solved ( 破解) 429 

Case of the Missing Parameters ( 缺失 参数 案件 ) 357 
Solved ( 破解】 358 

Case of the Moving Expectation ( 活动 期 望 案例 ) 211 
Solved ( 破解】 220 

The Case of the Ambiguous Average ( 案例 : 含 含糊 糊 

的 平均 值 】 51 

Solved [ 破解) 81 

The Case of the Two Classes { 瑜伽 班 与 游泳 班 案例 ) 185 
Solved ( 破解】 188 

formulas for arrangements ( 排 位 方式 的 计算 公式 ) 248 
frequencies ( 频数】 8, 23, 67-68, 73 

comparing ( 比较 】 14 

continuous data ( 连续 数据 ) 328 

cumulative frequency ( 累积 频数 ) 34-38, 42 

highest frequency group of values ( 上 共有 最 高 频数 的 类 ) 

52 


315 


消失 的 咖啡 销量 ) 421 


histograms ( 直方 图 ) 24-30 
percentages with no frequencies { 无 频数 百分数 】 12 


frequency density ( 频数 密度 ) 27-32. 68 
Frequency Density Up Close { 频数 密度 细 细 看 ) 29 
frequency scales ( 频数 刻度 } 13 


4 


Gaussian distribution { 高 斯 分 布 ) 352 


geometric distribution ( 几何 分 布 ) 277-287, 297, 301, 
324 
guide ( 指南 ) 284 
inequalities { 不 等 式 ) 279 
pattern of expectations !( 期 望 模式 ) 280-281 
variance { 方差 ) 281-284 
Geometric Distribution Up Close ( 几何 分 布 细 细 看 } 
goodness of fit ( 拟 合 优 度 ) 573 
test ( 检验 】 579 
graphs ( 图 形 ， 参 见 : charts and graphs ) 
grouped data ( 分 组 数据 】 .19 


278 
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和 


height probabilities ( 身高 概率 ) 338-341 
histograms ( 直方 图 ) 19-28 


frequency ( 频数 ) 24-30, 25 
intervals (区间 ) 20 


making ( 使 得 ) 20 
making area proportional to reguaney ( 使 面积 与 频 
数 成 比例 】 26-28 


mean ( 均值 ) 56 

unequal intervals ( 不 等 宽 区 间 ) 24-30 

when not to use ( 何 时 不 用 ) 33 
herizontal bar charts { 水 平 条 形 图 ) 
horse racing ( 赛马 】 243-246 


hypothesis tests { 假设 检验 】 521-566 
alternate hypothesis { 备 择 假 设 ) 529-530, 543 
critical region ( 拒绝 域 ] 531-534, 539. 548 
critical value ( 临界 值 ) 532 
null hypothesis { 原 假 设 ) 528, 543 
one-tailed tests { 单 尾 检验 ) 534, 539 
p-value ( p 值 ) 539 
power of a hypothesis test ( 假设 检验 的 功效 】 561 
process ( 过 程 ) 526-539 
overview ( 总 览 ) 527 
Step 1: Decide on the hypothesis { 第 1 步 ， 确 定 要 
进行 检验 的 假设 ) 528-529, 543 
Step 2: Choose the test statistic { 第 2 步 : 选择 检验 
统计 量 ) 531, 544 
Step 3: Determine the critical region ( 第 3 步 ， 确定 
用 于 做 决策 的 拒绝 域 ) 532, 548 
Step 4: Find the p-value { 第 4 步 ， 求 检验 统计 量 的 
p 值 ) 535-536 
Step 5: ls the sample result in the critical region? { 
第 5 步 : 查看 样本 结果 是 否 处 于 拒绝 域内 ) 537 
Step 6: Make yeur decision { 第 6 步 : 做 出 决策 ) 
537 
significance level { 显著 性 水 平 ) 533, 538, 539 
statistically significant ! 统计 显著 性 ) 551 
test statistic ( 检验 统计 量 】 531, 539, 544, 547 
two-tailed tests ( 双 尾 检验 ) 534, 539 
Type 1 error !( 第 一 类 错误 】 555-560, 566 
Type ll error ( 第 二 类 错误 】 555-560, 566 


11, 23 


incorrect sampling unit ( 抽样 单位 不 正确 ) 425 


independence ( 独立 性 } 573 


independent events ( 独立 事件 】 182-183, 189-190 
versus mutually exclusive { 互 斥 ) 183 


independent observations ( 独立 观察 结果 ) 
377, 472 


expectation ( 期 望 ) 378 

of X { X 的 …. ) 233 

variance { 方差 ) 378 

versus linear transforms ( -……: 与 线性 变换 } 376-378 


independent random variables { 独立 随机 变量 ) 230-233， 
368 


indpendent variables { 独立 变量 ) 608, 646 
information ( 信息 ) 

versus data { ……- 与 数据 ) 5 

visualizing { 图 形 化 ， 参 见 ，visualizing information ) 
interpercentile range ( 百 分 位 距 ) 98, 102 
interquartile range { 四 分 位 距 ) 92-93, 97 


average distance ( 平均 距离 ) 105 
versus the median { ……: 与 中 位 数 } 97 


intersecting events ( 相交 事件 ) 147~154 
intersection ( 交集 } 149-154 


K 


kth percentile { 第 k 百 分 位 数 ) 99, 102 


L 


Law of Total Probability | 全 概率 公式 ) 172, 178 
least Squares regression ( 最 小 二 乘 回归 法 ) 626, 648 


Least Squares Regression Up Close { 最 小 二 乘 回归 法 细 细 
看 ) 626 


leaves (时) 644 
left-skewed data { 左 偏 余数 据 ) 62, 64 


letters, using to represent numbers ( 用 字母 表示 数字 ) 
d48-49 


linear correlations { 线性 相关 } 613, 630-631 
Linear Correlations Up Close { 线性 相关 经 细 看 ) 613 
linear regression |( 线性 回归 ) 626, 640, 650 


linear relationship between E{X) and E(Y} ( E(Y 与 EM 之 间 
的 线性 关系 } 217-218 


linear transforms { 线性 变换 } 219, 220, 224-226 


224-226， 


distribution ( 分 布 ) 376 
expectation and variance ! 期 望 与 方差 ) 233 
versus independent observations { …… 与 独立 观察 结 
果 ) 376-378 
versus playing multiple games ( -…-… 与 多 玩 几 局 赌博 
游戏 } 221 
line charts ( 线形 图 } 41, 42 
Line Charts Up Close { 线形 图 细 细 看 ) 41 


line of best fit { 最 佳 拟 合 线 ) 618, 622, 640 
finding equation ( 求 公式 ) 622 
finding slope ( 求 斜 率 ) 623-624 
minimizing errors ( 误差 最 小 化 】 5620-621 
non-linear | 非 线 性 】 650 
surn of squared errors { 误差 平方 和 )】 
lower bounds ( 下界 ) 86, 97 
basketball scores ( 篮球 赛 得 分 】 88 
lower quartile { 下 下 分 位 数 ) 92 
finding { 求 …… ) 94 


M 


matched pairs design (experiments) { 配对 设计 】 647 
mean ( 均值 ) 47-60 

basketball scores ( 篮球 赛 得 分 ) 88 

binomial distribution { 二 项 分 布 】 389 

calculating ( 计算 ) 50 

calculating when to use ( 计算 何 时 使 用 ) 78 
mean {continued} (均值 { 续 ) ) 

categorical data { 类 别 数据 ) 62 

distributions ( 分 布 ) 56 

frequencies ( 频数 } 52 

frequency density ( 频数 密度 } 68 

histograms ( 直方 图 ) 56 

of two middle numbers ( 两 个 中 间 数 】 61 

outliers { 异常 值 ) 57-59 

positive and negative distances ( 正 负 印 离 ) 

problems with ( 问题 ) 65--72 

skewed data ( 偏 斜 数据 】 62, 64 

standard deviations from { 标准 差 ) 121 

Using letters to represent numbers | 用 字母 表示 数 

字 】 48-49 

versus median { …… 与 中 位 数 ) 62 

X+Y¥ 368 

hh ( 细 ) 50 

Z ( 西格玛 ) 49 


620~621 


105 


measuring probability { 量度 概率 ) 132 
median ( 中 位 数 ) 61-70 
calculating when to use ( 计算 何 时 使 用 】 78 
categorical data ( 类 别 数据 ) 62 
frequency density ( 频数 密度 ) 68 
in three steps ( 三 步 法 ) 62 
middle quartile { 中 间 的 四 分 位 数 ) 92 
problems with { 问题 ) 65-72 
skewed data ( 偏 斜 数据 】 64 
versus mean ( 均值} 62 
versus the interquartile range 【 ……- 与 四 分 位 距 ) 97 
middle quartile ( 中 间 的 四 分 位 数 】 92 
modal class ( 众 数组 】 73 
mode ( 众 数 】 73-80 
calculating when to use ( 计算 何 时 使 用 } 78 
categorical data ( 类 别 数据 ) 73 
three steps for finding { 求 … 三 步 法 】 74 
mu { 参见 : p ( 绢 ) ) 
multiple sets of data ( 多 批 数据 ) 14, 23 
mutually exciusive events ( 互 斥 事件 ) 147, 150 


N 


n! 248 
negative linear correlation ( 负 线 性 相关 ) 613, 631, 640 
no correlation { 不 相关 ) 613, 631 
No Dumb Questions { 世上 没有 贫 问 题 ) 
adding probabilities { 概率 相 加 ) 143 
alternate hypothesis ( 备 择 假设 } 530 
approximating binomial distributieon { 近似 二 项 分 布 ) 
398 
arranging objects in circle ( 对 象 环 形 排列 】 248 
average distance { 平均 距离 ) 
interquartile range ( 四 分 位 距 ) 105 
Bayes” Theorem ( 贝 叶 斯 定理 ) 179 
bias { 偏 倚 ) 426, 434 
binomial distribution { 二 项 分 布 】 301, 412 
bivariate data ( 二 变量 数据 } 616 
box and whisker diagram ( 箱 线 图 ) 101 
breaking data into more than four pieces ( 将 数据 分 割 
为 四 块 以 上 ) 97 
central limit theorem { 中 心 极限 定理 ) 485 
charts (图表 ) 5 
clustered Sarnpling ( 整 群 抽样 ) 434 
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confidence intervals { 区 信 区 间 ) 491. 518. 539 
confidence intervai versus confidence level ( 置信 区 间 
与 置信 水 平 ) 507 
continuity corrections ( 连续 性 修正 ) 398, 412 
continuous data ( 连续 数据 ) 370 
continuous distributions ( 连续 分 布 ) 352 
correlation coefficient ( 相关 系数 ) 634 
cumulative frequency ( 累积 频数 ) 36 
degrees of freedom ( 自由 度 】 576, 595 
discrete data ( 离散 数据 ) 370 
discrete random variable { 离散 随机 数据 】 203 
distribution of X+Y ( X+Y 的 分 布 ] 370 
drawing lots ( 抽签 ) 434 
E(X, + X,) and E(2X) ( E(X1 + X2) 与 EL2X) ) 224 
expectation { 期 户 ) 208, 219 
factorials ( 阶 科 】 248 
frequency density { 频数 密度 】 30 
Gaussian distribution { 高 斯 分 布 】 352 
geometric distribution ( 几何 分 布 ) 277, 284, 301 
histograms [ 直方 图 ) 23, 30 
how data is spread out ( 数据 分 艇 方式 ) 97 
hypothesis tests { 假设 检验 ) 530, 552 
independent events ( 独立 事件 ) 184 
independent observations |( 独立 观察 结果 ) 378 
independent versus mutually exclusive { 独立 与 互 斥 ) 184 
information versus data { 信息 与 数据 ) 5 
interquartile range ( 四 分 位 距 ) 97 
limit on intersecting events { 相交 事件 ) 154 
linear transforms { 线性 变换 ) 219, 378 
line charts ( 线形 图 ) 42 
line of best fit { 最 佳 拟 合 线 ) 624 
mean or median with categorical data ( 类 别 数据 的 均 
值 或 中 位 数 ) 62 
mean with skewed data { 有 偶 笠 数据 的 均值 】 62 
median ( 中 位 数 ) 352 
Versus mean [ ……: 与 均值 ) 62 
versus the interquartile range ( …… 与 四 分 位 距 ) 97 
nl 248 
normal distribution ( 正 态 分 布 ) 
accuracy of { …… 的 精确 性 ) 398 
approximating binomial or Poisson distribution ( 近 
似 二 项 分 布 或 泊 松 分 布 ) 412 
normal probability tables ! 正 态 概率 表 ) 352 
null hypothesis ( 原 假设 } 530 
outliers ( 异常 值 } 634 
PlBlack] Even) ( PI 黑 | 偶 ) ) 179 
permutations and combinations ( 排列 与 组 合 】 263 


arranging by type ( 按 种 类 排列 ) 257 
point estimators { 点 估计 晤 ) 446, 452 
and sarnpling distributions ( 与 抽样 分 布 } 485 
Poisson distributions { 泊 松 分 布 ) 311, 314, 412 
approximating binomial distribution { 近似 二 项 分 
布 ) 317, 398 
population mean ( 总 体 均值 】 446 
positive and negative distances { 正 负 距离 ]) 105 
probabilities wnitten as fractions, decimals, or 
percentages ( 以 分 数 、 小 数 表示 概率 或 百分数 ) 
139 
probability ( 概率 】 139 
best method { 最 佳 方法 ) 143 
probability density function { 概率 密度 函数 ) 334 
probability distributions ( 概率 分 布 】 203 
letters p and 9 ( 字母 p 和 q ) 284 
quiz show { 智力 游戏 节目 ) 290 
probability for standardized range ( 标准 化 数值 范围 的 
概率 】 347 
probability of range ( 数值 范围 概率 ) 352 
probability tables { 概率 表 ) 352, 370 
probability trees ( 概率 树 ) 165, 179 
proportion versus probability ( 比例 与 概率 ) 456 
questionnaires | 调查 问卷 ) 426 
random variables { 随机 变量 ) 233 
right- and left-skewed data ( 左右 偏 斜 数据 ) 62 
roulette wheel { 轮 盘 赌 】 184 
sample mean { 样本 均值 ) 446 
sarnple variance ( 样本 方差 ) 452 
sampling bias { 抽样 偏 倚 ) 434 
sampling distribution { 抽样 分 布 ) 466 
sampling frame ( 抽样 框架 ) 426 
scatter diagrams ( 散 点 图 } 616 
set theory ( 集合 论 】 139 
shortcuts { 简捷 算法 ) 370 
significance level ( 显著 性 水 平 ) 539 
significance tests { 显著 性 检验 ) 552 
slot machines ( 老虎 机 ) 208 
standard deviation { 标准 差 ) 113, 122, 208 
standard error ( 标准 误差 】 485 
of proportion ( 比例 ) 466 
standard scores ( 标准 分 ) 122, 347. 352 
outliers ( 异常 值 】 122 
statistical sampling { 统计 抽样 ) 
bias ( 偏 倚 ) 426 
clustered sampling ( 整 群 抽样 ) 434 
drawing lots { 抽签 ) 434 
increasing sample size ( 增 大 样本 ) 434 


simple random sampling { 简单 随机 抽样 } 434 
stratified sampling ( 分 层 抽 样 } 434 

stratified sampling ( 分 层 抽 样 ) 434 

systematic sampling { 系统 抽样 ) 434 

t-distributions ( t 分 布 ) 518 

target population { 目标 总 体 ) 426 

Type | error { 第 一 类 错误 } 560 

Type ll error ( 第 二 类 错误 ) 560 

variance { 方差 ) 122, 208 

variance equations ( 方差 公式 】 113 

variances ( 方差 】 219 

Venn diagrams ( 维 因 图】 139, 165, 184 

X2 (chi Square) distribution { 好 ( 卡 方 ) 分 布 } 595 

X2 (chi square) tests { X2 { 卡 方 ) 分 布 } 576 


no linear correlation ( 非 线 形 相关 ) 630 

non-linear relationships { 非 线 性 关系 ) 650 

normal approximation ( 正 态 近似 ) 394 

normal distribution ( 正 态 分 布 ) 325-360, 361-414 


accuracy of ( 精确 性 ) 398 

approximating continuity correction ( 近似 连续 性 修正 ) 
396 

approximating binomial distribution { 近似 二 项 分 布 ) 
386 

approximating binomial or Poisson distribution { 近似 
二 项 分 布 或 泊 松 分 布 ) 412 

approximating binomial probabilities { 近似 二 项 概率 ) 
397 

binomial distribution ( 二 项 分 布 ) 384, 389, 392-393 

approxirnating ( 近似 ) 398, 407 

continuous { 连续 ) 395 

continuous data ( 连续 数据 ) 337, 365 

continuous distributions ( 连续 分 布 】 352 

continuous probability distributions ( 连续 概率 分 布 ) 
337 

defined { 定义 } 339-340 

discrete data { 离散 数据 ) 337 

discrete data versus continuous data { 离散 数据 与 连 
续 数 据 ) 326-327 

empirical rule ( 经 验 法 则 】 645 

finding < probabilities ( 所 型 概率 的 求解 ) 397 

finding > probabilities { 之 型 概率 的 求解 】 397 

finding between probabilities { “ 介 于 ”型 概率 的 求解 ) 
397 

frequency and continuous data ( 频数 与 连续 数据 ) 328 

Gaussian distribution { 高 斯 分 布 】 352 

height probabilities ( 身高 概率 ) 338-341 
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in place of binomial distribution ( 代替 二 项 分 布 ) 389 
median { 中 位 数 ) 352 

normal probability tables { 正 态 分 布 表 ) 352 

Poisson distribution ( 泊 松 分 布 ) 386, 406 

Pool Puzzle ( 奇妙 池 } 399-400 

probability = area ( 概率 = 面积 ) 331 

probability density function { 概率 密度 函数 ) 


330-337, 337 
probability for standardized range ( 标准 化 数值 范围 的 
概率 ) 347 


probability of range ( 标准 化 数值 范围 ) 352 
probability tables ( 概率 表 ) 349-352 
standard score ( 标准 分 ) 345-347, 352 
table ( 表格 ) 411 
transforming ( 变换 ) 345 
versus binomial distribution { …… 与 二 项 分 布 } 
395 
versus t-distributions { …… 与 t 分 布 】 515 
Normat Distribution Exposed { 正 态 分 布 访 谈 ) 404 
normal probabilities ( 正 态 概 率 ) 359 
calculating ( 计算) 341-352 
determining distribution ( 确定 分 布 ) 343 
standardizing norrnal variables ( 正 态 变 量 标准 化 ) 
344 
tables { 表格 ) 349-352, 352, 658-659 
nu ( 参见 v ( 正 态 变量 } ) 
null hypothesis { 原 假 设 ) 528, 530, 543 
numbers, using letters to represent ( 数字 ， 用 字母 表示 ) 
48-49 
numerical data ( 数字 数据 ) 


0 


observations ( 观察 } 222-224 
independent { 独立 ) 224 
shortcuts { 速算 法 ) 223 


one-tailed tests | 单 尾 检 验 ) 534. 539 


outliers { 异常 值 ) 57-59, 89-91, 93, 634 
interquartile range ( 四 分 位 距 } 93 
standard scores | 标准 分 ) 122 


了 


p-value (Pp 值 ) 535-536, 539 
percentage sales ( 百分数 刻度 】 12 


393, 


18, 23 
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percentages with no frequencies { 无 频数 百分数 } 12 


percentiles ( 百 分 位 数 } 98-99, 102 
kth percentile { 第 k 百 分 位 数 】 99, 102 
perfect negative linear correlation ( 完全 负 线 性 相关 ) 631 
perfect positive linear correlation ( 完全 正 线性 相关 ) 631 
permutations and combinations ( 排列 与 组 台 ) 241-268 
arrangernents ( 排 位 ) 246 
arranging by type ( 按 种 类 排列 ) 252-257 
arranging duplicates { 重复 排列 ) 254 
arranging objects in circle ( 圆 形 排 位 ) 247-248 
combinations { 组 合 ) 260-263, 293 
examining combinations |( 何 为 组 合 ) 260-263 
examining permutations { 和 何 为 排列 ) 258-259 
factorial ( 阶乘 ) 246 
formulas for arrangements { 排 位 方式 的 计算 公式 ) 248 
penmutations versus combinatons ( 排列 与 组 合 比较 】 261 
three-horse race ( 三 马赛 ) 243-246 
pie charts ( 饼 图 ) 8-9, 9 23 
placebo { 安 昧 剂 ) 646 
point estimators ( 点 估计 量 ) 443-447, 452. 493, 519 
and sampling distributions ( 抽样 分 布 ) 485 
for population variance ( 总 体 方差 } 457 
problem with { 问题 ) 489 
Poisson distribution ( 泊 松 分 布 ) 306-319, 324, 386, 
406, 407, 412 
approximating binomial distribution { 近似 二 项 分 布 ) 
398 


approximating the binomial distribution ( 近似 二 项 分 布 ) 
316-317 

central limit theorem { 中 心 极限 定理 ) 482 

expectation and variance { 期 望 与 方差 ) 308 

guide ( 指南 ) 319 

when 入 is large ( 当 和 很 大 】 407 

when 入 is small ( 当 入 很 小 】 407 

X+Y 312-313 
Poisson Distribution Up Close ( 泊 松 分 布 细 细 看 】 307 
Poisson variables, combining ( 泊 松 变量 ， 组 合 】 313 


Pool Puzzle { 奇妙 池 ) 
binomial distribution { 二 项 分 布 ) 299-300 
confidence intervals ( 置信 区 间 ) 499-500 
continuity correction ( 连续 性 修正 } 399-400 
discrete probability distributions { 离散 概率 分 布 ) 
215-216 


population { 总 体 ) 418, 438 
chart ( 图 表 】 419 
mean ( 均值 ) 446 
proportion ( 比例 ) 454-455, 457 
variance {方差} 448-450 
versus samples ( …… 与 样本 )】 418 
{ 后 时 参见 总 体 和 样本 的 估计 ) 
positive and negative distances { 正 负 距离 ) 105 
positive linear correlation { 正 线性 相关 ) 613, 631, 640 
possibility space ( 概率 空间 } 135 
precision, problem with ( 精度 ， 问 题 ) 489 
probability ( 概率 ) 127~196 
= area { 等 于 面积 】 331 
adding ( 相 加 ) 142, 143 
Bayes” Theorem { 贝 叶 斯 定理 ) 173, 178 
best method ( 最 佳 方法 ) 143 
conditional ( 条 件 】 157-160 
probability tree ( 概率 树 ) 
events ( 事件 ， 和 参见 ， events ) 
fora sample ( 用 于 样本 ) 459 
how probability relates to roulette | 概率 与 辊 盘 赌 的 
关系 】 132 
intersection ( 交集 ) 149-154, 153 
Law of Total Probability { 全 概率 公式 ) 
measuring ( 量度 ) 132 
of getting a black or even ( 出 现 黑色 或 偶数 …… ) 
145-146 
proportion (比例 】 455 
range of values { 数值 范围 ) 329 
union ( 并 集 ) 149-154, 153 
Venn diagram ( 维 因 图 】 136, 154 
written as fractions, decimals, or percentages { 记 作 分 
数 、 小 数 或 百分数 ) 139 
probability density ( 概率 密度 】 334 
function ( 函数 } 330-337 
never equaling 0 ( 永远 不 会 等 于 0 ] 341 
probability distributions ( 概率 分 布 ) 220, 224, 363 
A4X 376 
binomial ( 二 项 ， 参 见 : binornial distribution ) 
continuous data ( 连续 数据 ) 329-333 
geornetric { 几何 ， 参 见 : geometric distribution ) 
large number of possibilities ( 大 量 概 率 】 273, 277 
letters p and 9q ( 字母 p 和 q ) 284 
new price and payouts ( 新 价 码 与 赔 率 ) 212-214 
nermal ( 正 态 ， 参 见 ， normal distribution ) 


158-161 


172, 178 


of X+Y {Xt+Y) 372 

patterns ( 固定 模式 】 274-277 

Poisson (see Poisson distribution) { 泊 松 ) 

random variable X ( 随机 变量 X ) 210 

standard deviation { 标准 差 ) 207 
Probability Distributions Up Close { 概率 分 布 细 细 看 ) 202 
probability tables ( 概率 表 ) 349-352, 352, 370, 513, 

657-661 
standard normal probabilities { 标准 正 态 概率 ) 
658-659 

t-distribution critical values { t 分 布 临界 值 } 660 

x? (chi square}) critical values { x? ( 卡 方 ) 临界 值 661 
Probability Tables Up Close ( 概 宁 表 细 细 看 ) 351 


probability trees ( 概率 树 ) 158-161, 165, 180 
hints ( 决策 ) 161 
proportions ( 比例 } 9 
probability ( 概率 ) 455 
sarnpling distribution of ( 抽样 分 布 】 460 
distribution of Ps ( P. 分 布 ) 464-466 
expectation of P, ( P, 期 望 ) 462 
variance of P, ( P, 方 其) 463 
standard error of { 标准 值 】 463 


Q 


qualitative data { 定性 数据 ) 18 


quartiles ( 四 分 位 数 ) 92 
interquartile range ( 四 分 位 距 } 92-93 


lower { 下】 92,94 
middle {中 } 92 
upper {上 】 92,94 


questionnaires, bias { 调查 问卷 ， 偏 倚 }) 426 


R 


randomization ( 随机 化 } 646 


randomized block design (experiments)( 随机 化 区 组 设 
计 】 647 


random number generators { 随机 编号 生成 器 ) 431 


random variables ( 随机 变量 ) 202 
adding (加 )} 230 
continuous ( 连续 ) 331 
independent ( 独立 ) 233 
subtracting { 减 】 231 


索引 673 


range (… 距 ) 86-103, 97, 329, 333 
basketball Scores { 篮球 赛 得 分 ) 88 
calculating {计算 } 86 
lower bound {下 界 】 86 
outliers ( 异常 值 ) 89-91 
problems with ( 问题 ) 90 
quartiles ( 四 分 位 数 】 92 
upper bound ( 上 界 】 86 
regression { 回归 ， 参 见 : correlation and regression } 
replication { 复制 ) 646 
response variable ( 反应 变量 } 608 
right-skewed data { 右 偏 斜 数据 ) 62, 64 
roulette { 轮 盘 赌 ) 129-196 
black and even pockets ( 黑色 和 偶数 球 位 ) 156 
board ( 轮 盘 板 ) 129-130 
how probability relates to { 概率 与 … 的 关系 ) 132 
independent events |( 独立 事件 ) 184 
measuring probability ( 量度 概率 } 132 
P(Black | Even) ( P{ 黑 | 惕 ) ) 167-171 
PtEven} ( P( 偶 ) ) 169 
possibility space ( 概率 空间 ) 135 
probabilities { 概率 ) 135 
probability of ball landing on ( 停 球 结果 为 7 的 概率 ) 7 
133-134 
sample space { 样本 空间 ) 135 


4 


samples {样本} 418, 438 
biased ( 偏 倚 ) 424-426 
designing ( 设计 】 422-423 
mean ( 均值 ) 445, 446 
space { 空间 ) 135 
survey | 调查 ) 418, 438 
unbiased ( 无 偏 倚 ) 424-426 
unreliability { 不 可 排 ) 420 
variance { 方 答 ) 449, 452 
( 同时 参见 估计 总 体 与 样本 ) 
sampling ( 抽样 ， 参 见 ，statistical sampling ) 
sampling distribution { 抽样 分 布 】 466 
difference between two means { 两 个 均值 之 间 的 差异 ) 
652 
difference between two proportions { 两 个 比例 之 间 的 
差异 ) 653 
sampling distribution of means ( 均值 的 抽样 分 布 ) 
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471-479 
distribution of x ( X 的 分 布 】 480 
variance of X ( X 的 方差 】 476 
sampling distribution of proportion { 比例 的 抽样 分 布 ) 460 
distribution of P.[ P, 的 分 布 ) 464-466 
expectation of P，( P. 的 期 望 ) 462 
variance of P。( P ,的 方差 ) 463 


Sampling Distribution of Proportions Up Close ( 比例 的 抽 
样 分 布 细 细 看 ) 469 


Sampling Distribution of the Means Up Close !( 均值 的 抽样 
分 布 细 细 看 ) 479 


sampling frame ( 抽样 框架 ) 423-428, 438 
bias ( 偏 倚 ) 425 
sampling units { 抽样 单位 ) 422, 428 
bias ( 偏 位 } 425 
sampling without replacement { 不 重复 抽样 ) 430 
sampling with replacernent { 重复 抽样 ) 430 
scales ( 刻度 ) 12 
scatter diagrams { 散 点 图 ) 609, 612, 616, 618, 640 
line of best fit ( 最 佳 拟 合 线 】 618 
finding equation ( 求 方程 ) 622 


finding slope { 求 斜 率 ) 623-624 
sum of squared errors | 误差 平方 和 ) 620-621 


scatter plots (see scatter diagrams} ( 散 点 图 } 
segmented bar chart { 分 段 条 形 图 ) 14 
set theory ( 集合 论 } 139 
shortcuts ( 简捷 算法 】 370 
sigma 人 2) ( 西格玛 ( 工 ) ) 49 
sigma (9) ( 西格玛 (G) ) 107 
significance level ( 显著 性 水 平 ) 533, 538, 539 
significance tests ( 显著 性 检验 } 552 
simple random sarnpling ( 简单 随机 抽样 ) 430-431, 434， 
436, 438 
drawing lots ( 抽签 】 431 
random number generators ( 随机 编号 生成 器 ) 431 
skewed data { 偏 作 数据 ) 58-59, 64 
mean (均值 ) 62 
Skewed Data Up Close { 偏 余 数据 细 细 看 ) 59 
skewed to the left { 左 偏 斜 ] 59 
skewed to the right ( 右 偏 科 】 58-59 
slope of regression line ( 回归 线 斜 率 ) 


confidence intervals ( 置信 区 间 ) 651 

slot machines ( 老虎 机 ) 198 
discrete random variables ( 离散 随机 变量 ) 202 
low versus high variance { 低 方 差 与 高 方差 ) 208 
probability distributions ( 概率 分 布 ) 201 
variance ( 方差】 207 

split-category bar chart ( 分 立 条 形 图 】 14 

standard deviation ( 标准 差 ) 107-110, 113-117, 207, 220 
from the mean { 从 均值 ) 121 
variance equations { 方差 公式 } 113 
G lsigma) (0 (西格玛) ) 107, 224 

Standard Deviation Exposed ( 标准 差 访 谈 ) 108 


standard error ( 标准 误差 ) 485 

of mean ( 均值 … ) 479 

of propertion ( 比例 … } 463, 466 
standardizing normal variables ( 正 态 变 量 标准 化 ) 344 
standard normal probabilities ( 标准 正 态 概率 ) 658-659 


standard scores ( 标准 分 } 118-122, 345-347, 352 
calculating ( 计算) 119 
interpreting ( 解释 ) 120 
Standard Scores Up Close { 标准 分 细 细 看 ) 121 
statistical sampling ( 统计 抽样 ) 415-440 
bias in sarmpling ( 抽样 偏 傈 ) 423-426, 434, 438 
sources { 来源) 425 
choosing samples ! 选择 抽样 ) 430 
cluster sampling ( 整 群 抽样 】 433, 433-434, 436, 438 
defined ( 确定 ) 418 
designing samples { 设计 样本 ) 422 
drawing lots { 抽签 } 431, 434 
how it works ( 抽样 方法 ) 419 
incorrect sampling unit ( 抽样 单位 不 正确 ) 425 
increasing sample size ( 增 大 样本 】 434 
population ( 总 体 】 418, 438 
population chart ( 总 体 图 】 419 
populations versus sarnples { 总 体 与 样本 】 418 
random number generators { 随机 编号 发 生 器 】 431 
representative sample ( 代表 性 样本 ) 420 
samples ( 样本 】 438 
unreliability ( 不 可 靠 】 420 
sample survey { 样本 调查 } 418, 438 
sampling bias ( 抽样 偏 倚 ) 434 
sampling chart ( 抽样 图 ) 419 
sampling frame !( 抽样 框架 ) 423-428, 438 
sampling units ( 样本 单位 ) 422, 428 


sampling without replacement ( 不 重复 抽样 ) 430 
sampling with replacement ( 重复 抽样 ) 430 
simple random sampling ( 简单 随机 抽样 】 430-438 
choosing ( 选择 抽样 】 431 

strata ( 层 } 432 
stratified sampling ( 分 群 抽样 ) 432, 434, 436, 438 
systematic sampling ( 系统 抽样 ) 433-434, 438 
target population ( 目标 总 体 ) 422, 428, 438 
unreliability { 不 可 靠 } 420 

statistics { 统计 量 ) 
defined ( 定义 ) 2 
why learn ( 为 何 学 习 ) 3 

statistics tables ( 统计 表 } 657-661 
standard normal probabilities ( 标准 正 态 概 率 ) 

658-659 

t-distribution critical values ( t 分 布 临界 值 } 660 
X2 (chi square) critical values { x2{ 卡 方 ) 临 界 信人 ) 661 

stemplots ( 芭 叶 图 ) 644 

stems ( 节 ) 644 

strata ( 层 ) 432 

stratified sampling ( 分 群 抽样 ) 432-438 

stratified sampling ( 分 群 抽样 ) 436 

summation Symbol 也 ( 求 和 符号 ( 卫 ) ) 49 

sum of squared errors | 误差 平方 和 ) 640 

symmetric data { 对 称 数 据 ) 59 

systematic sampling { 系统 抽样 ) 433-434, 438 


T 


t-distributions (1t 分 布 ) 509-515 
probability tables ( 概率 表 】 513 
shortcuts ( 简便 方法 ) 515 
smail sample ( 小 样本 ) 510 
standard score ( 标准 分 ) 511 
table { 表 ) 660 
versus normal distributions { ……: 与 正 态 分 布 } 515 


target population ( 目标 总 体 ) 422, 426. 428, 438 
test statistic ( 检验 统计 最 ) 531, 539, 544, 547 
three-horse race ( 三 马赛 】 243-246 

two-tailed tests ( 双 尾 检测 ) 534, 539 

Type | error ( 第 一 类 错误 ) 555-560, 566 

Type ll error ( 第 二 类 错误 ) 555-560, 566 
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U 


unbiased sample { 非 俩 倚 样 本 ) 424-425 
uniform distribution ( 均匀 分 布 ) 655 
union ( 并 集 ) 149-154 
univariate data ( 单 变量 数据 ) 608, 640 
upper bounds (上 界 】 86, 97 

basketball scores | 篮球 赛 得 分 ) 88 
upper quartile ( 上 四 分 位 数 】 92 

finding ( 求解 】 94 


V 


variability ( 差异 性 ) 104-124 
average distance ( 平均 距离 】 105 
positive and negative distances { 正 负 距离 ) 
variance [ 方差 ,参见 : variance ) 
variables { 变量 】 368 
probabilities involving the difference between two |( 两 
个 变量 之 差 的 概率 ) 369 
variance | 方差 ) 106-113, 122, 205-208, 219, 220, 367 
binomial distribution { 二 项 分 布 ) 298, 389 
caiculating ( 计算 ) 111-113 
quicker way ( 更 快 方法 }】 113 
geometric distribution { 几何 分 布 ) 281-284 
independent observations ( 独立 观察 结果 ) 378 
linear transforrns ( 线性 变换 】 233 
of X (X.... )】 476 
Poisson distribution { 泊 松 分 布 】 308 
slot machines ( 老虎 机 】 207 
standard deviation |( 标准 差 】 107-110 
G (sigma) (G ( 西格玛) ) 107 
two games ( 两 局 赌局 ) 222-224 
X+Y 368 
Variance Up Close { 方差 细 细 看 ) 450 


Venn diagrams ! 维 恩 图】 136, 139, 154. 165 
conditional probability { 条 件 概率 ) 157 
independent events ( 独立 事件 ) 184 

vertical bar charts ( 垂直 条 形 图 ) 10-11, 23 

visuafizing information ( 信息 图 形 化 ) 1-44, 19-28 
categorical ed numerical data ( 类 别 数据 与 数字 数据 ) 

18-2 
cumulative frequency ( 累积 频数 } 34-38 


105 
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histograms { 直方 图 ) 

statistics ( 统计 量 ) 2 

{ 参见 图 形 图 表 ) 
Vital Statistics ( 重要 统计 量 } 

A 太 or B {A 或 B) 153 

approximating binomial distribution ( 近似 二 项 分 布 ) 389 

approxirnating Poisson distribution { 近似 泊 松 分 布 ) 407 

arranging by type { 按 种 类 排列 ) 254 

Bayes” Theorem ( 贝 叶 斯 定理 } 178 

combinations ( 组 合 ) 263 

conditions ( 条 件 概率 】 165 

cumulative frequency ( 累积 频数 ) 34 

event ( 事件 ) 132 

formulas for arrangernents ( 排 位 方式 的 计算 公式 } 248 

frequency ( 频数) 8 

independence ( 独立} 184 

independent cbservations { 独立 观察 结果 ) 224 

interquartile range { 四 分 位 距 ) 93 

Law of Total Probability { 全 概率 公式 ) 178 

linear transforms ( 线性 变换 ) 220 

mean |( 均值 ) 54 

mode {模式} 76 

outlier ( 异常 值 ) 58 

percentile { 百 分 位 数 ) 99 

permutations ( 排列) 263 

probability ( 概率 】 143 

quartiles ( 四 分 位 数 ) 92 

range ( 距 ) 86 

significance level { 显著 性 水 平 ) 533 

skewed data ( 偏 斜 数据 ) 58 

standard score { 标准 分 】 346 

uniform distribution { 均匀 分 布 】 655 

variance | 方差 】 106, 113 


W 


Watch it! ( 小心! 】 

criteria of np>10and ng >10 (条件: np>10 与 nq >10) 389 

cumulative frequencies ( 累积 频数 ) 35 

exclusive versus exhaustive ( 互 斥 与 穷 举 ) 150 

how large n needs to be { n 需 要 有 多 大 ) 465 

independent random variables ( 独立 随机 变量 ) 
230-232 

independent versus mutually exclusive ( 独立 与 互 斥 } 
183 

linear regression ( 线性 回归 } 626 


19-28 


percentages with no frequencies ( 无 频数 百分数 】 12 

quartiles ( 四 分 位 数 】 92 

samples equation { 样本 公式 ) 451 

subtracting random variables ( 减 去 随机 变量 } 231 

X, +X and2X (X, +X, 和 2X) 223 

Who Wants To Win A Swivel Chair { 转椅 赢 高 赢 } 289， 
381-386 

expectation and variance ( 期 望 与 方差 ) 304 

generalizing probability for three questions { 推 而 广 之 
至 求 3 个 问题 的 概率 ) 293 

generalizing the probability { 进一步 推导 概率 算式 】 296 

probability of getting exactly three questions right ( 答 
对 三 题 的 概率 ) 304 

probability of getting exactly two questions right ( 答对 
两 题 的 概率 ) 304 

probability of getting no questions right { 一 题 也 答 不 对 

率 ) 304 

probability of getting two or three questions right ( 答 
对 两 题 或 三 题 的 概率 ) 304 

should you play or walk away ( 玩 下 去 ， 还 是 转身 走 ) 291 

width of data ( 数据 宽度 ) 88 


X 


X+Y Distribution Up Close ( X+Y 分 布 细 细 看 ) 368 
X -YDistribution Up Close ( X -YY 分 布 细 细 看 ) 369 


Z 


z-scores (z 分 } 118-122 
calculating {计算 】 119 
interpreting ( 释义 ) 120 
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